阿里HappyHorse 1.0上線實測:生成GTA式畫面,馬斯克奧爾特曼“隔空交鋒”

   時間:2026-04-27 22:14 來源:天脈網作者:楊凌霄

阿里ATH創新事業部近日宣布,其最新研發的視頻生成與編輯模型HappyHorse 1.0(中文譯名:快樂小馬)正式啟動灰度測試。創作者可通過阿里云百煉平臺和HappyHorse官方網站注冊使用,普通用戶則能在千問App中搶先體驗這一創新產品。

在盲測平臺Arena.ai的最新排名中,HappyHorse 1.0在文生視頻、圖生視頻和視頻編輯三個核心榜單上均位列第二,緊隨近期備受關注的字節跳動Seedance 2.0之后。為全面評估該模型的實際表現,專業團隊進行了多維度測試。

該模型操作簡便,用戶僅需輸入文字描述,即可生成3至15秒的視頻內容,支持多鏡頭切換和連貫劇情設計。官方數據顯示,HappyHorse 1.0最高支持1080p分辨率,可同時生成4個視頻版本。價格方面,720p視頻每秒0.9元,1080p視頻每秒1.6元;Pro套餐經限時折扣后,價格分別降至每秒0.44元和0.78元。

目前,HappyHorse 1.0已集成至阿里旗下多款產品,包括阿里悟空、MuleRun和JVS Claw等Agent平臺。千問App預告將推出"測一測"功能,用戶可測試自己在短劇宇宙中的角色,并通過該模型生成個人"出演"的短劇片段。

測試結果顯示,HappyHorse 1.0在指令響應和生成速度方面表現突出,但在物理準確性、音畫同步等方面仍有改進空間。具體而言,該模型具有三大優勢:生成速度快(2-5分鐘/段)、指令理解能力強(支持復雜鏡頭和風格要求)、多元素還原度高(圖生視頻中人物、場景、道具還原精準)。不過,測試也發現其存在音畫不同步(樂器演奏場景中手部動作與音頻節奏錯位)、長視頻物理邏輯錯誤(10秒以上視頻易出現物體自移動現象)、文字渲染錯誤(畫面文字常出現亂碼)等問題。

在文生視頻測試中,該模型展現了強大的場景理解能力。例如,在"街頭音樂表演"場景中,模型雖能準確呈現鼓手敲擊、吉他演奏和觀眾互動等元素,但吉他手的手部動作與音樂節奏存在明顯不同步。在"海邊懸崖"場景測試中,模型成功模擬了海浪沖擊巖石的物理效果,但近景畫面中水滴下落速度偏慢。面對800詞超長提示詞的復雜場景描述(類似《GTA》游戲畫面),模型雖能還原大部分元素,但開頭出現車門無故關閉的物理錯誤,結尾主角形象也發生變化。

圖生視頻測試中,該模型支持最多9張參考圖輸入。在"奧爾特曼與馬斯克對簿公堂"的測試案例中,模型雖能生成兩人爭論畫面,但初期版本存在"馬斯克"說中文、人物表情偏差等問題,經提示詞優化后有所改善。在"離職場景"測試中,模型準確還原了上傳的人物、辦公室和紙箱等元素,但出現紙箱自動合上等物理錯誤。

行業專家評價,HappyHorse 1.0的3-15秒生成長度、快速響應能力和1080p支持是其核心優勢。某AI電商營銷平臺技術合伙人指出,當前視頻生成模型普遍存在質量不穩定問題,部分團隊"抽卡率"高達50%-60%,生成時效性也有待提升。相比之下,價格因素反而是用戶較易接受的維度。另一AI視頻創作平臺團隊認為,該模型在真實感和敘事能力上表現優異,鏡頭運動自然,焦段運用接近實拍效果,特別適合紀錄片類內容創作。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號