網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

網(wǎng)易有道開源AI LobsterAI，實(shí)現(xiàn)圖片視頻生成

2026-06-02 11:37:27　來源: i黑馬

北京舉報(bào)

分享至

國(guó)內(nèi)大廠首個(gè)開源AI智能體產(chǎn)品LobsterAI（網(wǎng)易有道龍蝦）近日宣布上線圖片生成與視頻生成能力，同時(shí)一次性接入了Seedream、Seedance、HappyHorse、MiniMax-Hailuo等四款主流多模態(tài)大模型。

這是繼2026年2月網(wǎng)易有道推出國(guó)內(nèi)首個(gè)100%代碼開源的桌面級(jí)智能體以來，LobsterAI在能力邊界上的又一次重要擴(kuò)展。

從產(chǎn)品形態(tài)上看，LobsterAI本身并非一個(gè)自研的圖像或視頻生成模型，而是一個(gè)整合型桌面智能體。

它依托開源社區(qū)已有能力，通過界面集成將多個(gè)第三方模型的能力納入統(tǒng)一工作流，用戶無需在不同網(wǎng)頁(yè)間切換，即可在一個(gè)對(duì)話框內(nèi)完成從關(guān)鍵幀生成到動(dòng)態(tài)視頻延伸的全流程。

在計(jì)費(fèi)方面，LobsterAI建立了透明積分體系，視頻生成按秒計(jì)費(fèi)，用戶執(zhí)行前會(huì)收到明確的積分消耗提示。

以具體場(chǎng)景來看，用戶可以讓Seedream生成宮崎駿風(fēng)格的關(guān)鍵幀，然后讓Seedance將其延展為動(dòng)態(tài)視頻，甚至在寫兒童故事的同時(shí)生成風(fēng)格統(tǒng)一的插畫。

不過，LobsterAI這種策略并非沒有代價(jià)。首先，視頻生成能力高度依賴第三方模型，用戶需要為接入的模型付費(fèi)。據(jù)相關(guān)報(bào)道，視頻生成任務(wù)費(fèi)用約為100積分/秒，長(zhǎng)期使用成本相對(duì)較高。

相比之下，一個(gè)競(jìng)爭(zhēng)性選擇來自阿里巴巴的WAN（萬象）系列，后者是完全開源、可本地部署的視頻生成模型，1.3B版本可在8GB顯存的消費(fèi)級(jí)顯卡上運(yùn)行，采用Apache 2.0商用授權(quán)，對(duì)開發(fā)者和中小企業(yè)的長(zhǎng)期成本更具優(yōu)勢(shì)。

另一個(gè)角度是從模型層面的能力看LobsterAI所接入的模型。2026年的AI視頻生成賽道已經(jīng)形成了比較清晰的格局，字節(jié)跳動(dòng)的Seedance依托即夢(mèng)等產(chǎn)品，已經(jīng)鋪開了商業(yè)化版圖，主打敘事連貫性和生態(tài)成熟度。

阿里巴巴的HappyHorse 1.0則采用完全開源的策略，突然登上全球AI評(píng)測(cè)平臺(tái)Artificial Analysis的Video Arena排行榜榜首，在文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻兩項(xiàng)核心評(píng)測(cè)中雙雙登頂，力壓Seedance 2.0、可靈3.0等主流模型。

值得注意的是，HappyHorse采用了150億參數(shù)的統(tǒng)一Transformer架構(gòu)，實(shí)現(xiàn)了原生音視頻同步生成，即畫質(zhì)和聲音在同一個(gè)模型內(nèi)部完成協(xié)同，不需要后期配音。

而LobsterAI接入了HappyHorse，但用戶通過它調(diào)用該模型時(shí)獲得的是能力，而非自主部署的靈活性，也無法進(jìn)行模型的二次開發(fā)或LoRA微調(diào)，這在定制化需求上的局限性比較明顯。

還需要看到的是，國(guó)內(nèi)大廠在AI開源領(lǐng)域的整體氛圍正在發(fā)生變化。Hugging Face發(fā)布的2026年春季全球開源AI生態(tài)報(bào)告顯示，過去一年該平臺(tái)上41%的大模型下載量來自中國(guó)研發(fā)的模型，國(guó)產(chǎn)開源大模型全球累計(jì)下載量突破100億次。

阿里、騰訊、字節(jié)等都在推進(jìn)不同程度和方向的AI開源布局，但各家的打法存在顯著分化。

網(wǎng)易有道也在加速自己的AI戰(zhàn)略布局，2026年5月下旬宣布將"子曰4"多模態(tài)模型（27B參數(shù)規(guī)模）和語(yǔ)音合成模型全量開源，該模型面向教育場(chǎng)景，在處理帶圖表的高難度視覺數(shù)理問題上達(dá)到了行業(yè)頂尖水平。

網(wǎng)易有道的策略是清晰的，以開源智能體為入口，降低普通用戶接觸多模態(tài)AI的門檻，再通過接入行業(yè)頂尖模型提供一站式創(chuàng)作體驗(yàn)。在這個(gè)過程中，有道自身也在積累模型能力，"子曰4"的開源布局為后續(xù)可能的技術(shù)轉(zhuǎn)向預(yù)留了空間。

行業(yè)觀點(diǎn)認(rèn)為，2026年大模型多模態(tài)能力的重點(diǎn)將是全模態(tài)融合、圖像和音視頻的性能持續(xù)提升。同時(shí)，多模型矩陣式整合正在成為新趨勢(shì)，用戶可以一個(gè)平臺(tái)體驗(yàn)多種模型優(yōu)勢(shì)。LobsterAI的上線正是這一趨勢(shì)的具體體現(xiàn)。

但難點(diǎn)同樣明顯。如何在保證用戶體驗(yàn)的同時(shí)控制成本，如何在接入第三方模型的情況下構(gòu)建差異化競(jìng)爭(zhēng)力，能否在后續(xù)版本中將集成模型的能力更深度地嵌入工作流、實(shí)現(xiàn)場(chǎng)景化的智能串聯(lián)，這些都將直接影響LobsterAI的長(zhǎng)期價(jià)值。

而對(duì)于網(wǎng)易有道而言，更大的考驗(yàn)在于這個(gè)開源智能體最終能否為其AI生態(tài)帶來真正的商業(yè)增長(zhǎng)，而不僅僅是技術(shù)展示。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.