智快網 - 新科技與新能源行業網絡媒體

阿里HappyHorse 1.0來襲!實測圖生視頻,馬斯克奧爾特曼“法庭激辯”

   發布時間:2026-04-27 22:22 作者:蘇婉清

阿里ATH創新事業部近日宣布,其最新研發的視頻生成與編輯模型HappyHorse 1.0(中文譯名:快樂小馬)已正式開啟灰度測試。創作者可通過阿里云百煉平臺和HappyHorse官網注冊使用,普通用戶則能在千問App中體驗這一創新技術。

在盲測平臺Arena.ai的最新評測中,HappyHorse 1.0在文生視頻、圖生視頻和視頻編輯三個榜單上均位列第二,僅次于近期備受關注的字節Seedance 2.0。為驗證其實際效果,相關團隊進行了多維度測試。

用戶只需輸入簡單的文字描述,HappyHorse 1.0即可生成3秒至15秒的視頻,支持多鏡頭切換和連貫劇情。該模型最高支持1080p分辨率,最多可同時生成4個視頻。價格方面,生成720p和1080p視頻的刊例價分別為每秒0.9元和1.6元,Pro套餐包月價格疊加限時折扣后為每秒0.44元和0.78元。

目前,HappyHorse 1.0已集成到阿里旗下多款產品中,包括阿里悟空、MuleRun和JVS Claw等Agent平臺。千問App預告將推出“測一測”視頻玩法,用戶可測出自己在短劇宇宙中的本名角色,并通過HappyHorse 1.0生成本人“出演”的角色短劇片段。

測試結果顯示,HappyHorse 1.0在指令遵循和生成速度方面表現突出,但在畫面物理準確性、音畫同步等方面仍有改進空間。具體而言,該模型生成視頻僅需2至5分鐘,與其他同類模型相比具有競爭力;能準確理解并執行復雜的提示詞要求,包括鏡頭運動、畫面構圖和風格氛圍等;在圖生視頻中,能高度還原上傳的參考元素,如人物、場景和道具等。然而,在樂器演奏等復雜場景中,模型生成的手部動作與音頻節奏存在明顯錯位;10秒以上的長視頻中,容易出現無外力物體自移動等物理錯誤;畫面中的文字常出現亂碼或錯誤。

在文生視頻能力測試中,HappyHorse 1.0展現了較強的指令遵循能力。例如,在“街頭音樂表演”場景中,模型生成的人像無肢體異常,鏡頭運動和畫面燈光符合要求,但吉他手演奏與音樂節奏不同步。在“海邊懸崖”場景中,模型成功模擬了波濤洶涌的效果,海浪與巖石的撞擊符合物理規律,但近景畫面中水滴滑落速度略慢。

測試還考察了HappyHorse 1.0對超長提示詞的理解能力。在一段長達800詞的提示詞測試中,模型準確呈現了畫面中的幾乎所有元素,包括人物、天氣、環境和建筑等。然而,開頭畫面出現車門無外力自動關閉的物理錯誤,最后一個鏡頭中主角形象發生變化,顯示一致性方面有待提升。

在圖生視頻測試中,HappyHorse 1.0支持最多9張圖片參考。測試中,模型成功生成了OpenAI聯合創始人薩姆·奧爾特曼喝咖啡的畫面,人物與真人照片相似度達8成左右。在多人物參考測試中,模型初始生成結果未能體現馬斯克與奧爾特曼爭吵的效果,經細化要求后,能生成二人用英語爭論的畫面,但人物表情與參考圖存在偏差。在多元素參考測試中,模型準確呈現了上傳的所有參考元素,但畫面中出現紙箱自動合上、門自動打開等物理錯誤。

業內人士對HappyHorse 1.0的表現給予了不同評價。出海一站式AI電商營銷平臺麥斯國際的技術合伙人李明認為,3秒至15秒的生成長度、較快的生成速度和支持1080p是該模型的亮點,但在生成結果一致性和語音內容機械感方面仍有提升空間。參與內測的AI視頻創作平臺FLOVA團隊則認為,HappyHorse 1.0在真實感與敘事能力上表現不錯,尤其適合敘事性內容和紀錄片風格題材,其焦段運用接近實拍,鏡頭運動自然。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群