國(guó)內(nèi)大廠首個(gè)開源AI智能體產(chǎn)品LobsterAI(網(wǎng)易有道龍蝦)近日宣布上線圖片生成與視頻生成能力,同時(shí)一次性接入了Seedream、Seedance、HappyHorse、MiniMax-Hailuo等四款主流多模態(tài)大模型。
這是繼2026年2月網(wǎng)易有道推出國(guó)內(nèi)首個(gè)100%代碼開源的桌面級(jí)智能體以來,LobsterAI在能力邊界上的又一次重要擴(kuò)展。
從產(chǎn)品形態(tài)上看,LobsterAI本身并非一個(gè)自研的圖像或視頻生成模型,而是一個(gè)整合型桌面智能體。
它依托開源社區(qū)已有能力,通過界面集成將多個(gè)第三方模型的能力納入統(tǒng)一工作流,用戶無需在不同網(wǎng)頁(yè)間切換,即可在一個(gè)對(duì)話框內(nèi)完成從關(guān)鍵幀生成到動(dòng)態(tài)視頻延伸的全流程。
在計(jì)費(fèi)方面,LobsterAI建立了透明積分體系,視頻生成按秒計(jì)費(fèi),用戶執(zhí)行前會(huì)收到明確的積分消耗提示。
以具體場(chǎng)景來看,用戶可以讓Seedream生成宮崎駿風(fēng)格的關(guān)鍵幀,然后讓Seedance將其延展為動(dòng)態(tài)視頻,甚至在寫兒童故事的同時(shí)生成風(fēng)格統(tǒng)一的插畫。
不過,LobsterAI這種策略并非沒有代價(jià)。首先,視頻生成能力高度依賴第三方模型,用戶需要為接入的模型付費(fèi)。據(jù)相關(guān)報(bào)道,視頻生成任務(wù)費(fèi)用約為100積分/秒,長(zhǎng)期使用成本相對(duì)較高。
相比之下,一個(gè)競(jìng)爭(zhēng)性選擇來自阿里巴巴的WAN(萬象)系列,后者是完全開源、可本地部署的視頻生成模型,1.3B版本可在8GB顯存的消費(fèi)級(jí)顯卡上運(yùn)行,采用Apache 2.0商用授權(quán),對(duì)開發(fā)者和中小企業(yè)的長(zhǎng)期成本更具優(yōu)勢(shì)。
另一個(gè)角度是從模型層面的能力看LobsterAI所接入的模型。2026年的AI視頻生成賽道已經(jīng)形成了比較清晰的格局,字節(jié)跳動(dòng)的Seedance依托即夢(mèng)等產(chǎn)品,已經(jīng)鋪開了商業(yè)化版圖,主打敘事連貫性和生態(tài)成熟度。
阿里巴巴的HappyHorse 1.0則采用完全開源的策略,突然登上全球AI評(píng)測(cè)平臺(tái)Artificial Analysis的Video Arena排行榜榜首,在文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻兩項(xiàng)核心評(píng)測(cè)中雙雙登頂,力壓Seedance 2.0、可靈3.0等主流模型。
值得注意的是,HappyHorse采用了150億參數(shù)的統(tǒng)一Transformer架構(gòu),實(shí)現(xiàn)了原生音視頻同步生成,即畫質(zhì)和聲音在同一個(gè)模型內(nèi)部完成協(xié)同,不需要后期配音。
而LobsterAI接入了HappyHorse,但用戶通過它調(diào)用該模型時(shí)獲得的是能力,而非自主部署的靈活性,也無法進(jìn)行模型的二次開發(fā)或LoRA微調(diào),這在定制化需求上的局限性比較明顯。
還需要看到的是,國(guó)內(nèi)大廠在AI開源領(lǐng)域的整體氛圍正在發(fā)生變化。Hugging Face發(fā)布的2026年春季全球開源AI生態(tài)報(bào)告顯示,過去一年該平臺(tái)上41%的大模型下載量來自中國(guó)研發(fā)的模型,國(guó)產(chǎn)開源大模型全球累計(jì)下載量突破100億次。
阿里、騰訊、字節(jié)等都在推進(jìn)不同程度和方向的AI開源布局,但各家的打法存在顯著分化。
網(wǎng)易有道也在加速自己的AI戰(zhàn)略布局,2026年5月下旬宣布將"子曰4"多模態(tài)模型(27B參數(shù)規(guī)模)和語(yǔ)音合成模型全量開源,該模型面向教育場(chǎng)景,在處理帶圖表的高難度視覺數(shù)理問題上達(dá)到了行業(yè)頂尖水平。
網(wǎng)易有道的策略是清晰的,以開源智能體為入口,降低普通用戶接觸多模態(tài)AI的門檻,再通過接入行業(yè)頂尖模型提供一站式創(chuàng)作體驗(yàn)。在這個(gè)過程中,有道自身也在積累模型能力,"子曰4"的開源布局為后續(xù)可能的技術(shù)轉(zhuǎn)向預(yù)留了空間。
行業(yè)觀點(diǎn)認(rèn)為,2026年大模型多模態(tài)能力的重點(diǎn)將是全模態(tài)融合、圖像和音視頻的性能持續(xù)提升。同時(shí),多模型矩陣式整合正在成為新趨勢(shì),用戶可以一個(gè)平臺(tái)體驗(yàn)多種模型優(yōu)勢(shì)。LobsterAI的上線正是這一趨勢(shì)的具體體現(xiàn)。
但難點(diǎn)同樣明顯。如何在保證用戶體驗(yàn)的同時(shí)控制成本,如何在接入第三方模型的情況下構(gòu)建差異化競(jìng)爭(zhēng)力,能否在后續(xù)版本中將集成模型的能力更深度地嵌入工作流、實(shí)現(xiàn)場(chǎng)景化的智能串聯(lián),這些都將直接影響LobsterAI的長(zhǎng)期價(jià)值。
而對(duì)于網(wǎng)易有道而言,更大的考驗(yàn)在于這個(gè)開源智能體最終能否為其AI生態(tài)帶來真正的商業(yè)增長(zhǎng),而不僅僅是技術(shù)展示。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.