大語言模型引全球大廠角逐,百度何以扛起中國科技大旗
【潮汐商業(yè)評論/原創(chuàng)】
最近,人工智能領(lǐng)域現(xiàn)象級產(chǎn)品ChatGPT在海內(nèi)外引發(fā)熱議,掀起一陣全球科技競速賽。百度將在3月16日圍繞其生成式AI產(chǎn)品、大語言模型“文心一言”召開新聞發(fā)布會,消息一出就引起了業(yè)界人士的廣泛關(guān)注。這意味著百度有機(jī)會成為全球第一個做出類ChatGPT的大語言模型的科技大廠。有外媒評價(jià)稱,中國的百度已將自己投入到全球商業(yè)化競賽中,這場關(guān)于生成式AI這樣的下一代人工智能技術(shù)將會給互聯(lián)網(wǎng)帶來重大變革。
1、多年AI沉淀,百度厚積薄發(fā)
文心一言由最新大語言模型(LLM)提供支持,是百度的生成式AI產(chǎn)品。雖然今年百度才對外宣布開發(fā)類ChatGPT產(chǎn)品文心一言,但這對于百度來說并不是從零開始,更不是突擊了一兩個月做出來的。
百度的文心大模型和OpenAI的GPT模型類似,早在2019年就已推出,且經(jīng)過了多次的迭代了,從剛開始單一的自然語言理解延伸到目前的多模態(tài),包括視覺、文檔、文圖、語音等多模態(tài)多功能,因此“文心一言”所基于的ERNIE系列模型也已經(jīng)具備較強(qiáng)泛化能力和性能。
百度是全球?yàn)閿?shù)不多、進(jìn)行全棧布局的人工智能公司,進(jìn)入人工智能時(shí)代之前,IT的技術(shù)棧一般可以分三層,底層的芯片,中間的操作系統(tǒng)和上層的應(yīng)用。進(jìn)入人工智能時(shí)代之后,百度的技術(shù)棧變成四層,分為芯片層、框架層、模型層和應(yīng)用層。
從這個節(jié)點(diǎn)上我們?nèi)タ矗还苁敲绹€是中國,全球范圍內(nèi)能夠在四層都有較強(qiáng)布局的公司是寥寥無幾。
具備四層全棧能力的好處是可以實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。針對一些特定場景,四層之間互相可以有較多反饋,做到極致的優(yōu)化。像在搜索場景,百度的芯片在百度的搜索上已經(jīng)優(yōu)化了十年,所以今天百度AI芯片,在搜索場景上,就是全球效率最高的。
而即將發(fā)布的文心一言是基于百度自主研發(fā)的產(chǎn)業(yè)級知識增強(qiáng)大模型,全景圖由模型層、工具與平臺層、產(chǎn)品與社區(qū)層構(gòu)成。在模型層,文心大模型已經(jīng)包括36個大模型,涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級體系,全面滿足產(chǎn)業(yè)應(yīng)用需求,構(gòu)建了業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系;在工具與平臺層,通過大模型開發(fā)套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發(fā)平臺,全方位降低應(yīng)用門檻;產(chǎn)品與社區(qū)層,包括AI藝術(shù)與輔助創(chuàng)作平臺“文心一格”、產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”和旸谷社區(qū),讓更多人零距離感受到最先進(jìn)的AI大模型技術(shù)帶來的新體驗(yàn)。2023年2月IDC發(fā)布《2022中國大模型發(fā)展白皮書》顯示,百度文心大模型處于行業(yè)第一梯隊(duì),產(chǎn)品能力、應(yīng)用能力、生態(tài)能力全面領(lǐng)先。
2、AI市場最佳代表,百度位居浪潮之巔
OpenAI、微軟想通過ChatGPT實(shí)現(xiàn)商業(yè)化落地,而他們的主要市場在英文場景,所以他們?yōu)橛⒄Z優(yōu)化是合理的。相反,百度并不試圖占領(lǐng)英語市場,作為中文自然語言處理起家的百度,必定會針對中文市場進(jìn)行優(yōu)化。
李彥宏也公開表示,百度的文心大模型是中國市場非常本土化的大模型,這意味著百度現(xiàn)在正在研發(fā)的文心一言,將比國外開發(fā)的模型更適合中國。其先進(jìn)性不僅體現(xiàn)為對中文語言的理解,還體現(xiàn)為對中國文化的理解。
按照百度的規(guī)劃,文心一言會率先落地在百度搜索。李彥宏也曾表示,文心一言將重塑信息的生成和呈現(xiàn)方式,推動搜索體驗(yàn)的代際變革,并作用于百度移動生態(tài)服務(wù)場景與市場規(guī)模的擴(kuò)大。一方面帶來更好的搜索和答案,另一方面用戶能直接與大語言模型交互,這將是對傳統(tǒng)搜索體驗(yàn)的補(bǔ)充、升級,有機(jī)會形成新的流量入口,吸引更多用戶,并獲得市場份額,同時(shí)賦能平臺廣告商、內(nèi)容創(chuàng)作者和商家。
此外,文心一言將通過百度智能云對外提供服務(wù),這將是百度“云智一體”戰(zhàn)略的里程碑,也意味著云市場游戲規(guī)則的根本性改變。
云服務(wù)從數(shù)字時(shí)代躍遷至智能時(shí)代,之前選擇云廠商更多看算力、存儲等基礎(chǔ)云服務(wù),未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用之間的協(xié)同。與此同時(shí),文心一言還將與小度進(jìn)行集成,升級小度智能設(shè)備和服務(wù)。
在馬太效應(yīng)愈發(fā)凸顯的當(dāng)下,科技競賽本身就是快魚吃慢魚,誰先卡位誰是贏家。所以從某種程度上來說,中國一定要有自己的ChatGPT,哪怕初期階段無法做到完美無缺,但若能達(dá)到ChatGPT去年問世的水平就實(shí)屬難得了。畢竟作為中國企業(yè)的唯一代表,能在此時(shí)第一個站在全球技術(shù)競賽的“奧運(yùn)賽場”上,“上場”這個行動本身就是一種勝利。
況且只要文心一言對外發(fā)布,數(shù)據(jù)、query閉環(huán)起來后,早上線一個月都意義非凡,且擁有巨大優(yōu)勢。同時(shí),隨著真實(shí)的用戶、開發(fā)者調(diào)用和模型迭代之間的飛輪開始轉(zhuǎn)動,大量訓(xùn)練會快速積累經(jīng)驗(yàn),系統(tǒng)會顯著提升,初期的不完美也會被不斷迭代。
轉(zhuǎn)載請?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)