近期,生成式視頻模型領(lǐng)域迎來重大進(jìn)展,字節(jié)跳動推出的視頻創(chuàng)作模型Seedance 2.0成為行業(yè)焦點(diǎn)。該模型發(fā)布后迅速在海外引發(fā)廣泛關(guān)注,科技界名人馬斯克在社交平臺X上轉(zhuǎn)發(fā)相關(guān)內(nèi)容并評論“It's happening fast”,這一舉動進(jìn)一步放大了市場對視頻生成技術(shù)快速發(fā)展的關(guān)注度,讓Seedance 2.0的討論熱度持續(xù)攀升。
Seedance 2.0憑借獨(dú)特的多模態(tài)創(chuàng)作方式和“自帶運(yùn)鏡”的呈現(xiàn)效果,在內(nèi)測階段就吸引了全球眾多目光。馬斯克的公開評價雖未涉及具體技術(shù)細(xì)節(jié),但強(qiáng)化了“發(fā)展速度”這一市場敘事。這不僅提升了外界對字節(jié)跳動多模態(tài)能力的關(guān)注,還可能對相關(guān)產(chǎn)業(yè)鏈的估值預(yù)期產(chǎn)生一定影響,使該模型的傳播從技術(shù)圈層擴(kuò)展到更廣泛的科技投資與產(chǎn)品關(guān)注人群。
字節(jié)跳動在產(chǎn)品化方面動作迅速。目前,Seedance 2.0已正式接入豆包App、電腦端和網(wǎng)頁版,全面融入豆包和即夢產(chǎn)品體系,同時上線火山方舟體驗中心,面向廣大用戶開放試用。對于企業(yè)端,字節(jié)跳動計劃在2月中下旬于火山方舟上線Seedance 2.0的API服務(wù),助力企業(yè)客戶更好地實(shí)現(xiàn)創(chuàng)意落地,這表明該模型不僅定位為創(chuàng)作工具,還在為更標(biāo)準(zhǔn)化的B端調(diào)用做準(zhǔn)備。
字節(jié)跳動對Seedance 2.0的定位頗具野心,強(qiáng)調(diào)其“質(zhì)量與可控性達(dá)到專業(yè)生產(chǎn)場景要求”。在功能方面,該模型亮點(diǎn)眾多。它支持多模態(tài)輸入,可混合文字、圖片、音頻、視頻四種模態(tài),參考構(gòu)圖、動作、運(yùn)鏡、特效、聲音等元素進(jìn)行創(chuàng)作。原聲音畫同步與多軌并行輸出功能,能實(shí)現(xiàn)背景音樂、環(huán)境音效或人物解說等音頻多軌輸出,并與畫面節(jié)奏精準(zhǔn)對齊。多鏡頭長敘事與“編導(dǎo)思維”讓模型可自動解析敘事邏輯,生成鏡頭序列,保持角色、光影、風(fēng)格與氛圍的統(tǒng)一。新增的視頻編輯與視頻延長能力,強(qiáng)化了“導(dǎo)演級操控”的工作流屬性。字節(jié)跳動還表示,Seedance 2.0較好解決了物理規(guī)律遵循及長效一致性等難題,運(yùn)動場景下的生成可用率達(dá)到業(yè)界領(lǐng)先水平。
盡管Seedance 2.0綜合表現(xiàn)處于行業(yè)領(lǐng)先地位,但字節(jié)跳動也坦誠指出其存在優(yōu)化空間。在產(chǎn)品介紹中明確提到,細(xì)節(jié)穩(wěn)定性、多人口型匹配、多主體一致性、文字還原精度和復(fù)雜編輯效果等方面仍有待提升,未來將持續(xù)探索大模型與人類反饋的深度對齊。
在合規(guī)與使用邊界方面,字節(jié)跳動也做出了明確規(guī)定。目前,Seedance 2.0限制使用真人圖像或視頻作為主體參考,若需使用真人作為主體參考,須經(jīng)本人驗證或取得授權(quán),這一限制將影響部分商業(yè)素材生產(chǎn)與投放鏈路的使用方式。
字節(jié)跳動火山引擎初步確定于2026年2月14日發(fā)布豆包大模型一系列重要升級,涉及豆包大模型2.0、音視頻創(chuàng)作模型Seedance 2.0、圖像創(chuàng)作模型Seedream 5.0 Preview,預(yù)計基礎(chǔ)模型能力和企業(yè)級Agent能力將有顯著提升。






















