視頻生成大模型兩極分化:向左刷榜“跑分”,向右刷屏“跑量”
文 | 智能相對論
作者 | 陳泊丞
果然,一如當年Sora的發布一般炸裂,在AI視頻生成上還得看國外廠商秀操作?!
在舉辦的2025 Google I/O開發者大會上,谷歌帶來視頻生成類大模型領域的又一重磅產品Veo 3。距離上一代Veo 2發布,才過去半年左右,Veo 3的更新非常炸裂,不僅成功實現了視頻與音頻的原生集成,包括音樂、背景音效,甚至是角色之間的對話也能自然生成,并根據畫面同步口型。
視頻生成類大模型全面開啟“有聲時代”。在Veo 3更強的物理規律理解與模擬下,當前AI視頻生成的真實感與沉浸感又上升了一個層級。
在這樣的效果面前,國產的視頻生成類大模型還有超越的可能嗎?先不說結果,只討論過去Veo 2發布后半年的行業歷程,在全球權威評測榜單VBench Leaderboard、Artificial Analysis上,這一領域的競爭格局并非一成不變,國內廠商如快手的可靈1.6pro、可靈2.0、阿里的通義萬相、生數科技的Vidu Q1等都曾陸續登頂榜首。
視頻作為當今內容消費的主要載體,在諸多領域都是擁有極高的流量和熱度。哪怕是在AI大模型領域,關于視頻生成類大模型賽道的競爭似乎也比其他細分領域要激烈些,廠商之間的“互毆”尤為精彩。
國產模型“暴打”海外模型?視頻生成類大模型的“螺旋式”互毆
前不久,全球權威評測榜單Artificial Analysis發布最新的全球視頻生成大模型榜單,繼快手的可靈1.6pro登頂榜首之后,可靈2.0再次以1124分的Arena ELO基準測試評分位居圖生視頻(Image to Video)賽道榜首,力壓一眾國內外主流視頻生成類模型。
可靈2.0是可靈AI在4月份發布的最新產品,自去年可靈AI上線以來,期間就歷經20多次的迭代。在這樣的高頻迭代之下,可靈AI迅速躋身全球視頻生成類大模型領域的第一梯隊,表現出強大的性能。
據可靈AI內部的多項勝負率測評,可靈2.0對比谷歌Veo 2的勝負比高達205%,而與OpenAI 的Sora相比,勝負比更是來到了367%,差距顯著。簡單來說,在谷歌未發布Veo 3的情況下,國產模型保持著大幅領先優勢。
實際上,在視頻生成類模型領域,快手可靈多次以綜合實力Top1的成績登頂權威測評榜單。這種國產勢力的崛起在這一領域并不“孤獨”,我們在分項榜單中依舊可以看到其他國產勢力的影子。
例如,生數科技的Vidu Q1在國內外權威測評榜單VBench Leaderboard和SuperCLUE上也曾登頂文生視頻和圖生視頻的分項榜首,超越Runway、Sora等一眾國外模型,展現出國內模型強大且穩定的性能表現。
更早之前,在今年1月,VBench Leaderboar榜單上的Top 1則是來自阿里的通義萬相2.1。相比當前的視頻生成模型,通義萬相2.1在復雜運動處理、現實物理還原、文字語義理解等方面都取得了相當不錯的成績,逐漸擺脫了AI感,趨于真實性。
總的來說,自OpenAI發布Sora,點燃視頻生成領域以來,這一細分賽道的競爭就尤為激烈,國產模型的崛起在各種榜單上也在全面與國外模型掰手腕,今天我登頂榜首,明天你把我擠下去,形成“螺旋式”互毆的局面。
同時,也正是在這種情勢下,AI視頻生成取得了相當大的進步,從一開始的“鬼畜”畫面到如今的音頻、畫面、人物、動作、背景等多重因素的高度協同集成與一致性保障,AI視頻越來越真實且具有沉浸感。
視頻生成類大模型的關鍵戰役:流量為王,誰能加冕?
比起在各大權威測評榜單“跑分”,反復超越同行來取得行業話語權,視頻生成類模型還有一場更關鍵的戰役:基于當前網絡用戶對視頻內容的消費熱情,迅速在社交媒體平臺完成創作“破圈”,以完成產品推廣、用戶教育以及商業探索等。
與Sora剛發布并不對外開放使用不同,谷歌在發布Veo 3當天即刻上線Flow平臺,面向市場開放使用。這不僅有技術成熟度提升的原因,更重要的是——當前,廠商們深知,視頻生成類大模型需要借助廣大市場用戶的創作、玩梗來造勢、吸引流量,從而提升產品知名度,更快地搶占市場。
簡單來說,視頻生成類大模型要“跑分”,更要“跑量”。越來越多的市場數據表明,以AI視頻為主導的內容消費正在加速形成,或將改善當前視頻生成類大模型的商業困境。
如今,抖音AI特效相關話題播放量超36億次,快手的AIGC廣告收入規模提升12倍,單日消耗峰值突破2000萬元。首部付費AI短劇《興安嶺詭事》已經在市場掀起熱潮,以AI+萌娃、AI+寵物等為主題的視頻創作大肆吸引用戶注意和平臺流量,廣告植入和帶貨能力迅速膨脹。據業內人士稱,該領域的單條廣告報價已經來到了2000-8000元,吸金能力還在上升。
這不僅是視頻生成類大模型的商業化探索,也是視頻內容創作產業鏈的一場變革和升級。據快手2024年三季報披露,可靈AI單月流水已超千萬元,并與伊利、vivo、聯想等頭部品牌達成深度合作。
這場圍繞用戶與市場注意力所展開的商業化競爭注定是一場“流量為王”的游戲。目前,抖音旗下的即夢AI正在復刻豆包的路徑,穩居蘋果App store的榜單前十,最高光時刻甚至一度登頂榜首。同時,根據QuestMobile的數據,從2024年12月底到2025年2月中旬,即夢的周活躍用戶數由約76萬增加到了近200萬,實現了接近三倍的增長。比起其他大模型的“跑分”,即夢AI的“跑量”策略已經在市場上初見成效。
只看市場反饋,國內視頻生成類大模型的商業化路徑似乎比國外廠商走的更寬走快。這是為什么?
谷歌的Veo 3需要用戶開通Ultra會員體系才能用,價格為125美元,相當于人民幣902.52元。同時,Ultra會員也并非無限使用,需要消耗一定的AI點數,每月付費也僅僅能出85條視頻左右。
嘗試過AI視頻生成的都知道,當前的大模型基本上很難一條“出片”,國外廠商的定價策略以及會員體系從根本上就限制了用戶大規模出片的能力。
相反,國內廠商采用免費版與會員制結合的策略,不僅每天送積分,吸引普通用戶嘗鮮,且會員體系的定價平均低于國外廠商,量大管飽,更能推動用戶大量出片,結合抖音、快手打通內容體系,實現高效刷屏,引發內容消費與高頻互動。
盡管在細節生成質量和行業競爭中仍有提升空間,但是國產視頻生成類模型基于不錯的性能表現、低門檻的產品體驗以及完善的內容消費產業鏈,率先跑出了一條商業路徑。截至今年3月,即夢AI月活用戶數量達到893萬,已經取得相當不錯的市場數據作為商業化支撐。
寫在最后
今天,不管是是國外廠商還是國內玩家,都試圖用視頻生成類大模型來撕開一道內容創作與消費的新口子。谷歌的Veo 3已經推動AI視頻進入有聲時代,而國內的可靈、即夢、通義萬相、海螺、Vidu等則是在大量的用戶創作中尋求市場供求關系的匹配與碰撞,從而帶來商業化的成功。
2025年的下半年,可以預想,或許用不了多久,谷歌的Veo 3就會被國內廠商超越,更強的模型繼續刷榜“跑分”,與此同時還得做到刷屏“跑量”,雙軌并行地推動視頻生成類大模型走向成熟,是未來的常態。
*本文圖片均來源于網絡
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。
?AI產業新媒體;
?澎湃新聞科技榜單月度top5;
?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
?著有《人工智能 十萬個為什么》
?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)