阿里HappyHorse 1.0開啟灰度測試,實測生成視頻能力有亮點也有不足

   時間:2026-04-28 09:24 來源:快訊作者:智東西

阿里ATH創新事業部近日宣布,其最新研發的視頻生成與編輯模型HappyHorse 1.0(中文名:快樂小馬)正式開啟灰度測試。該模型已在阿里云百煉平臺和HappyHorse官網開放注冊,普通用戶則可通過千問App進行體驗。這一消息引發了AI視頻生成領域的廣泛關注。

在盲測平臺Arena.ai的評估中,HappyHorse 1.0在文生視頻、圖生視頻和視頻編輯三個榜單上均位列第二,僅次于近期備受矚目的字節Seedance 2.0。為驗證其實際表現,相關團隊進行了多維度測試,發現該模型在指令遵循和生成速度方面表現突出,但在畫面物理準確性和音畫同步等方面仍有改進空間。

用戶只需輸入簡單的文字描述,HappyHorse 1.0即可生成3秒至15秒的視頻,支持多鏡頭切換和連貫劇情。官網信息顯示,該模型最高支持1080p分辨率,可同時生成4個視頻。價格方面,生成720p和1080p視頻的刊例價分別為每秒0.9元和1.6元,Pro套餐包月價格疊加限時折扣后為每秒0.44元和0.78元。

HappyHorse 1.0已被集成到阿里旗下多款產品中,包括阿里悟空、MuleRun和JVS Claw等Agent平臺。千問App預告將推出“測一測”視頻玩法,用戶可測出自己在短劇宇宙中的本名角色,并通過該模型生成本人“出演”的短劇片段。

測試過程中,HappyHorse 1.0展現了多項優勢:生成一段視頻僅需2至5分鐘,指令遵循能力強,能準確理解復雜提示詞要求,包括鏡頭運動、畫面構圖和風格氛圍等;圖生視頻功能可高度還原上傳的參考元素,如人物、場景和道具等。然而,該模型在音畫同步、長敘事物理準確性和文字渲染方面存在不足。例如,在樂器演奏場景中,手部動作與音頻節奏存在錯位;10秒以上的視頻易出現物理錯誤,如物體無外力移動;畫面中的文字常出現亂碼或錯誤。

在文生視頻測試中,HappyHorse 1.0成功完成了復雜動作與音畫同步的案例。例如,生成一段街頭音樂表演視頻時,模型準確呈現了鼓手敲擊、吉他手彈奏和觀眾互動的場景,但吉他演奏與音樂節奏存在不同步問題。在物理真實性測試中,模型還原了海浪拍打巖石、水花飛濺的效果,但近景畫面中水滴滑落速度略慢于物理規律。

該模型還展現了處理超長提示詞的能力。在一段長達800詞的提示詞測試中,模型準確呈現了畫面中的人物、天氣、環境和建筑等元素,但開頭出現車門無故關閉的物理錯誤,最后一個鏡頭中主角形象發生變化,顯示一致性有待提升。

在圖生視頻測試中,HappyHorse 1.0支持最多9張圖片參考。測試中,模型成功生成了奧爾特曼喝咖啡的畫面,人物相似度達8成,且樣貌未隨光線和背景變化而改變。在多人物參考測試中,模型初始生成結果未能體現爭吵效果,且“馬斯克”說中文,細化要求后生成了二人用英語爭論的畫面,但表情與參考圖存在偏差。在多元素參考測試中,模型準確呈現了上傳的所有人物和物體,但出現紙箱自動合上、門自動打開等物理錯誤。

業內人士認為,HappyHorse 1.0的3秒至15秒生成長度、較快生成速度和支持1080p分辨率是其亮點。在提示詞明確的情況下,模型產出效果尚可,但生成結果的一致性和語音機械感仍需改進。當前視頻生成模型的生成質量仍是普遍痛點,部分團隊“抽卡率”高達50%至60%,生成時效性也有待提升。相比之下,價格是用戶較易接受的維度。

參與測試的團隊表示,HappyHorse 1.0在真實感和敘事能力上表現不錯,尤其適合敘事性內容和紀錄片風格題材。其焦段運用接近實拍,鏡頭運動自然,減輕了視頻的“AI感”。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號