等不及Sora的老鐵,奔向快手可靈
率先卷出AI視頻的大廠,為什么是快手??????????????????????
文 | 陳梅希
編 | 園長
Open AI讓大模型風(fēng)暴席卷全球的最初那段時(shí)間里,快手并不是一個耀眼的角色。彼時(shí),百度拿出文心一言,阿里拿出通義千問,騰訊拿出混元大模型,彼此追趕,研發(fā)與開放速度都很快。
快手不在最初的角逐名單里,甚至到現(xiàn)在,都很少有人能叫出快手大語言模型的名字:快意。
戰(zhàn)局在今年的6月6日發(fā)生改變,快手視頻生成大模型可靈開放公測申請,那天也是快手13周年司慶日。媒體時(shí)常將可靈和Open AI的Sora對標(biāo),但從2月的爆炸性亮相后,Sora遲遲未向公眾開放。于是,好奇的中國用戶開始涌向可靈。
10天后,可靈“已經(jīng)(收到)好幾萬的申請量”,這一數(shù)據(jù)來自當(dāng)天參加智源大會的萬鵬飛,演講時(shí),他的頭銜是快手視覺生成與互動中心負(fù)責(zé)人,也是可靈的實(shí)際負(fù)責(zé)人。到7月19日,申請使用人數(shù)超過百萬。從萬量級到百萬量級的申請?jiān)鲩L,可靈只用了一個多月,在諸家大廠上半年的大模型進(jìn)展中,這是最亮眼的表現(xiàn)。
可靈生成的圖片,提示詞:蜜蜂在花叢中
翻身仗的故事總是大眾喜聞樂見的。但仔細(xì)盤點(diǎn)可靈及背后的快手大模型業(yè)務(wù)即可發(fā)現(xiàn),這不是一場低調(diào)蟄伏而后橫空出世的爽文戲碼,也不是天才少年帶領(lǐng)小團(tuán)隊(duì)后發(fā)制人的英雄敘事。
基于可靈所生成圖片進(jìn)一步生成的視頻,提示詞:蜜蜂飛來飛去
率先卷出AI視頻的大廠,為什么是快手?是業(yè)務(wù)需求帶來了強(qiáng)烈動因和高優(yōu)先級,是產(chǎn)品形態(tài)下的數(shù)據(jù)和技術(shù)積累帶來了迭代速度,是業(yè)務(wù)場景的匹配度帶來了真實(shí)客戶。
可靈的出現(xiàn),不是一個偶發(fā)事件。國內(nèi),快手在AI視頻領(lǐng)域的最大對手,大概率將來自字節(jié)跳動。
有需求,才有動因
創(chuàng)作者是快手內(nèi)容生態(tài)內(nèi)最重要的環(huán)節(jié)之一。根據(jù)快手官方公布的數(shù)據(jù),2023年,首次在快手發(fā)布短視頻的創(chuàng)作者就有1.38億,全年發(fā)布的視頻在平臺內(nèi)獲得超過1萬億次點(diǎn)贊。
擁有海量內(nèi)容創(chuàng)作者,意味著快手需要承接他們對于內(nèi)容工具的需求,否則追逐新興生產(chǎn)力的創(chuàng)作者,很快就會奔向其他工具乃至其他平臺的懷抱。這也是此前快影之于快手,和剪映之于字節(jié)的價(jià)值。
所以快手此前在大語言模型上的投入并不激進(jìn),但在多模態(tài)大模型的競爭中卻要力爭上游。
在可靈之前,快手自研的文生圖大模型能力已接入快手,內(nèi)測的結(jié)果是,用戶在評論區(qū)月均生成5億+AI圖片。
可靈生成的圖片,提示詞:外星人站在長江邊
需求帶來的強(qiáng)烈動因,固然是可靈橫空出世的必要條件,但擁有這些條件的并非只有快手一家。如果說對于可靈的問世還有什么重要的影響因子,那可能是決心。
決心首先來自快手高層。
此前,快手在大模型上的動作總是顯得稍慢半步。提及國產(chǎn)大語言模型,大家會率先想到文心一言、通義千問;提及大語言模型應(yīng)用,市場上風(fēng)頭正勁的是Kimi和豆包。到文生圖領(lǐng)域,國內(nèi)市場率先出圈的則是商湯的日日新5.0——發(fā)布第二天上午,商湯科技股價(jià)拉升超過30%,臨時(shí)停牌。
而此前的一系列故事里,快手在一個看似邊緣的位置。視頻大模型及其應(yīng)用,是其在風(fēng)口之爭最不容錯過的節(jié)點(diǎn),也是整體大模型布局中最重要的一環(huán)。
此前科技媒體硅星人的報(bào)道中,可靈團(tuán)隊(duì)技術(shù)人員稱:“蓋坤常說的就是,公司的卡都給你們用,公司全力支持。”蓋坤即于越,快手高級副總裁,擔(dān)任主站線業(yè)務(wù)負(fù)責(zé)人,兼任社會科學(xué)線負(fù)責(zé)人。前CTO陳定佳卸任后,蓋坤成為快手技術(shù)線最高負(fù)責(zé)人之一。
萬鵬飛及其團(tuán)隊(duì)可能擁有更甚的決心。一個細(xì)節(jié)是,在決定接手可靈項(xiàng)目后,萬鵬飛將原有承接各方業(yè)務(wù)需求的工作,交接給了張迪團(tuán)隊(duì)的其他同級別負(fù)責(zé)人。與之相對應(yīng)的,可靈團(tuán)隊(duì)的其他成員,也各自交接掉了手頭原有的業(yè)務(wù),全力投入可靈的研發(fā)中,周末加班趕進(jìn)度是工作常態(tài)。
基于可靈所生成圖片進(jìn)一步生成的視頻,提示詞:外星人在水里走動,兩個外星人擊掌
“其實(shí)正式發(fā)布一個多月前,可靈的測試效果都還不算太好。”一位大模型行業(yè)從業(yè)者告訴刺猬公社,“老萬他們算是背水一戰(zhàn)。后面真的是‘大力出奇跡’,最后能有這樣的效果,很多人都沒有預(yù)料到。”
于是決心成為最后一個變量。
有積累,才有速度
快手,或者說任何一個頭部短視頻平臺,在研發(fā)AI視頻上的積累體現(xiàn)在兩個方面,內(nèi)容和技術(shù)。
視頻由用戶生產(chǎn),經(jīng)過平臺的標(biāo)注理解,篩選出可被分發(fā)的內(nèi)容,這本就是快手業(yè)務(wù)邏輯中的固有路線。經(jīng)過處理的內(nèi)容成為一種數(shù)據(jù),從對內(nèi)容本身的描述,到分發(fā)后的受歡迎程度,快手掌握了海量的內(nèi)容數(shù)據(jù),通俗地說,他們既有內(nèi)容,也知道哪些是用戶愛看的“好內(nèi)容”。
對生成式視頻大模型的訓(xùn)練而言,這一過程好比提前把菜備好了。
甚至“廚子”也是現(xiàn)成的。
可靈項(xiàng)目組的大部分核心研發(fā)成員,都是萬鵬飛在Y-tech時(shí)期的老部下。年初,團(tuán)隊(duì)成員陸續(xù)接觸相關(guān)信息和資料,開始進(jìn)入可靈的研發(fā)工作中。
此前,萬鵬飛團(tuán)隊(duì)主要負(fù)責(zé)承接快手創(chuàng)作生態(tài)下的UGC智能創(chuàng)作需求,跟主站生產(chǎn)、快影、一甜相機(jī)等業(yè)務(wù)方合作緊密,產(chǎn)品形態(tài)包括人像美化、影音特效、直播虛擬形象等。
2021年,萬鵬飛在全球人工智能技術(shù)大會上曾以“Y-tech部門AI技術(shù)平臺負(fù)責(zé)人”身份公開演講,當(dāng)時(shí)分享的案例中,就有“活照片特效”——前大模型時(shí)代的圖生視頻玩法。當(dāng)年,快手和快影的模板庫就曾上線過“會動的老照片”特效,用戶上傳一張照片后,照片中的人物可以做出微笑、眨眼、點(diǎn)頭等動作,形成視頻效果。據(jù)報(bào)道,這一動態(tài)特效在快影的使用量超過344萬。
快手網(wǎng)友@森嶼和鹿 2021年發(fā)布的會動的老照片視頻
2021年的萬鵬飛就對生成式技術(shù)的發(fā)展非常有信心,并提出“生成模型會越來越強(qiáng)大,生成的內(nèi)容更加逼真,且生成的過程更加穩(wěn)定可控。”
三年后,可靈再度以“復(fù)活老照片”作品出圈,一些申請到使用權(quán)限的用戶,通過“圖生視頻”功能,將去世親人的照片轉(zhuǎn)變?yōu)橐曨l。和三年前的“活照片特效”相比,通過開放式的指令,用戶可以讓照片中的人物完成更復(fù)雜的動作,這正是新的大模型技術(shù)帶來的變化。
Sora發(fā)布于今年2月,快手可靈團(tuán)隊(duì)在接近的時(shí)間點(diǎn)開始組建,但對多模態(tài)驅(qū)動的視頻生成技術(shù)的研發(fā)和應(yīng)用,一直在萬鵬飛及其團(tuán)隊(duì)的工作范圍內(nèi)。
上述從業(yè)者向刺猬公社表達(dá)了相似的觀點(diǎn):“實(shí)際上Sora的出現(xiàn),相當(dāng)于讓大家在那個節(jié)點(diǎn)把技術(shù)路線或者說方案確定下來了,但是很多對視覺技術(shù)的應(yīng)用,包括多模態(tài)的事情是他們一直以來都在做的。”
可靈需要的技術(shù)層面積累正來自于此。廚子碰到了備好的菜,在全世界都看到一張新菜譜后,快手成為最快炒出成品的團(tuán)隊(duì)之一。
但同時(shí),上述從業(yè)者也對可靈能否長期在技術(shù)和產(chǎn)品上位于領(lǐng)先位置持觀望態(tài)度。“大家現(xiàn)在用的算法是類似的,各家可能有一些微調(diào),但大差不差。”在他看來,有卡、有數(shù)據(jù)、算法差不多,各家做出效果接近的產(chǎn)品只是時(shí)間問題。
所以速度只是快手暫時(shí)的優(yōu)勢,他們需要在領(lǐng)先的窗口期,把優(yōu)勢真正轉(zhuǎn)化為穩(wěn)定的客戶。
有場景,才有客戶
2020年12月29日,快手在內(nèi)部全員信里首次正式發(fā)布作為企業(yè)價(jià)值觀的“快手派”,并稱“癡迷客戶”是快手價(jià)值觀的核心。
此前,不管是快手內(nèi)部還是其他互聯(lián)網(wǎng)大廠,更常提及的概念是“用戶”。為此,快手特地解釋了這一詞匯變動的原因。“公司業(yè)務(wù)復(fù)雜度變高,從 ‘用戶’ 擴(kuò)展到 ‘客戶’,客戶包含了生產(chǎn)者和消費(fèi)者、B 端客戶和 C 端用戶、外部客戶和內(nèi)部客戶。我們需要加強(qiáng)對生產(chǎn)者、B 端客戶的理解與認(rèn)知,我們也需要強(qiáng)調(diào)對內(nèi)部客戶的服務(wù)意識。”
站在2024年回望,那確實(shí)是快手業(yè)務(wù)結(jié)構(gòu)變化的重要分水嶺。2020年,快手的全年?duì)I收中,直播營收占比從前一年的80.4%下降到56.5%,線上營銷服務(wù)營收占比從19%上升至37.2%,包括電商在內(nèi)的其他服務(wù)營收占比,則迅速從前一年的1%攀升至6.3%。
如同快手自己曾闡釋的那樣,生產(chǎn)者和消費(fèi)者、B 端客戶和 C 端用戶、外部客戶和內(nèi)部客戶,都是快手的重要客戶,也將成為快手大模型的目標(biāo)客戶。
生產(chǎn)者和消費(fèi)者,共同建構(gòu)了快手最基本的業(yè)務(wù)鏈條,生產(chǎn)者生產(chǎn)內(nèi)容,消費(fèi)者消費(fèi)內(nèi)容。大模型產(chǎn)品的價(jià)值,在于降低生產(chǎn)門檻,同時(shí)提升內(nèi)容質(zhì)量。
前者很好理解,正如可靈目前能實(shí)現(xiàn)的那樣,輸入文本或圖片,即可獲得一段視頻,對沒有拍攝條件和制作能力的人來說,生產(chǎn)門檻被大幅降低。
后者初聽有點(diǎn)反常識——以當(dāng)前AI視頻產(chǎn)品的擬真能力和輸出長度,怎么可能在質(zhì)量上勝過真實(shí)拍攝和專業(yè)制作?但在快手和抖音這樣的頭部平臺,每天被生產(chǎn)出的數(shù)千萬個短視頻中,大部分來自普通用戶,專業(yè)內(nèi)容生產(chǎn)者眼中“不夠精巧”的AI技術(shù),已經(jīng)足以讓普通用戶的隨手拍增添素材與豐富度。
B端商家同樣可能成為快手大模型能力的客戶。根據(jù)快手今年在世界人工智能大會上公布的數(shù)據(jù),其AI廣告收入已突破2000萬/天。AI生成的廣告素材,可以在單條成本降低到0.47元的同時(shí),將CTR保持在基準(zhǔn)線上。
可靈生成圖片,提示詞:蘋果汁廣告素材,白色桌面上有一杯蘋果汁,邊上有兩個紅蘋果
對很多大模型產(chǎn)品而言,找落地場景是貫穿產(chǎn)品生命周期的難題,但快手顯然不缺場景。正如快手副總裁、大模型負(fù)責(zé)人張迪說的那樣,可靈的出圈源自“在真場景中挖掘真價(jià)值滿足用戶的真需求”。
他們要面對的難題在于,在現(xiàn)有場景下,如何讓用戶成為快手大模型的高頻使用者,并愿意為此持續(xù)付費(fèi),先在自家生態(tài)內(nèi)實(shí)現(xiàn)大模型的商業(yè)化。
7月25日,可靈全面開放注冊,同一天,可靈上線會員體系,進(jìn)入收費(fèi)階段。
根據(jù)可靈官網(wǎng)信息,非會員用戶當(dāng)天每日登錄時(shí)可獲贈66個靈感值,按照當(dāng)前的“標(biāo)價(jià)”,大約可免費(fèi)生成6個視頻或330張圖片。
付費(fèi)模式則分為兩種,一是會員模式,用戶可以按月、季度、半年、一年為周期購買不同等級的會員,等級越高,可生成作品數(shù)越多;二是充值模式,用戶可以直接付費(fèi)充值,換算下來,用戶每個視頻的生成成本為1元,每張圖片的生成成本為2分錢。
可靈生成的圖片,提示詞:日出,天邊有漂亮的云彩和朝霞,太陽藏在云層里
對于可靈的定價(jià)體系,值得關(guān)注的有兩點(diǎn)。
一是快手沒有提供可無限次生成作品的會員選項(xiàng),這意味著,無論選擇充值模式還是會員模式,用戶實(shí)際上都在“花錢買次數(shù)”。區(qū)別只是每次生成的單價(jià),以及去水印、視頻延長、大師運(yùn)鏡等差異性功能。
AI視頻的生成成本高,不提供可無限次生成的會員,快手顯然是想避免可能出現(xiàn)的成本失控,也能在一定程度上遏制灰產(chǎn)。
二是作為可靈“支付貨幣”的靈感值,和快手生態(tài)內(nèi)打賞主播所用的快幣,在定價(jià)上是等值的。1塊錢人民幣,可以購買10個快幣,也可以購買10個靈感值。這樣的定價(jià)方式,或許是為后續(xù)在快手生態(tài)內(nèi)打通支付系統(tǒng)保留可能性。
同時(shí)擁有需求、場景、客戶、設(shè)備、數(shù)據(jù)、技術(shù)、人才儲備的,遠(yuǎn)不止快手一家。
上述行業(yè)人士預(yù)判,在不久的將來,字節(jié)就能做出同級別的生成式視頻產(chǎn)品。而在此之前,快手需要在窗口期內(nèi)完成用戶沉淀和內(nèi)容沉淀,讓AI內(nèi)容在快手生態(tài)內(nèi)有效運(yùn)轉(zhuǎn)起來,最好還能跑通商業(yè)化路徑,在領(lǐng)跑者的位置上坐得更久一點(diǎn)。
常規(guī)的增長和運(yùn)營手段已被提上日程。可靈官網(wǎng)迅速上線了會員全線五折活動,同時(shí)用戶每日登錄可獲得66個靈感值,以減少付費(fèi)模式對用戶增長和留存的影響,讓所有用戶至少可以先無門檻地使用嘗鮮。
此外,在快手站內(nèi)的運(yùn)營中,可靈并未過多強(qiáng)調(diào)生成式視頻、擴(kuò)散模型方案、分布式訓(xùn)練集群等概念,而是用“老照片變視頻”“穿越時(shí)空擁抱你”“復(fù)活40年前照片”等玩法,先吸引用戶上手使用,以降低用戶的理解成本。
對于普通用戶來說,新的玩法和過去的快影特效玩法難度一致路徑一致,他們將其理解為一種更強(qiáng)大的特效,無論是否聽說過“大模型”這三個字,都不妨礙他們成為大模型產(chǎn)品的實(shí)際用戶。
這正是快手和字節(jié)做AI視頻的終極先手,如果用戶是自家的;也是它們在AI時(shí)代面臨的終極危機(jī),如果用戶被新的斷層式產(chǎn)品吸引走。
與其說是它們要爭奪AI視頻時(shí)代的入口,倒不如說它們都是守擂者。新的生產(chǎn)力會制造出新的內(nèi)容形態(tài),最終造就新的平臺,這個故事,程一笑和張一鳴都再熟悉不過。
他們必須做第一梯隊(duì)。
(封面圖由可靈生成。)
媒介合作聯(lián)系微信號|ciweimeijiejun商務(wù)合作聯(lián)系微信號|yunlugong如需和我們交流可后臺回復(fù)“進(jìn)群”加社群
轉(zhuǎn)載請?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)