新火種AI|實屬罕見!四大AI頂流同臺,有哪些關鍵信息值得關注?
作者:小巖
編輯:彩云
在有著“AI春晚”之稱的2024年智源大會上,非常難得的一幕出現了:當下國內的四大AI頂流公司——月之暗面,百川智能,智譜AI,面壁智能齊聚一堂,十分罕見的同臺了。
從體量上來說,四家大模型公司都稱得上是獨角獸級別,它們的創始人聚在一起,分享各自對大模型未來的觀點和看法,這對于整個行業來說,無疑是值得標記的一筆。
有意思的是,這四家大模型獨角獸掌舵人——百川智能的CEO王小川,智譜AI CEO張鵬,月之暗面CEO楊植麟以及面壁智能聯合創始人,CEO李大海都出身于清華,是名副其實的師出同門。
關于價格,安全等話題:四家獨角獸給出的答案各有側重。
在智源大會上,四位出身于清華的大模型獨角獸掌舵人一同出席了《尖峰對話:通往AGI之路》環節。
在對話中,大家對于大模型的價格戰問題表達了自己的看法。王小川就公開表示,價格戰對于中國發展大模型是特別好的事,自己也是積極看待的。目前打響的大模型價格戰,主要是云廠商之間的競爭。包括火山引擎,阿里云,騰訊云,百度云等。
可在此之前,王小川是旗幟鮮明的反對價格戰的,表示這是巨頭間的游戲,百川智能不愿意摻和進去。
其實王小川先前的想法并非個例。零一萬物創始人李開復也在大會別的環節上表示,當下AI市場存在一個比較嚴重的問題,就是很多大公司沒有認識到軟件的價值,不愿意為軟件付費。結果很多大模型公司來競標,結果卻是越競越低,做到最后做一單賠一單,沒有利潤。也正因此,他認為,零一萬物堅決做to C,不做“賠錢的to B”。而智源研究院的院長王仲遠也認為,當下選擇大模型優先考慮的肯定不是性價比,而是能否真正為自己的產品賦能。在此基礎之上,大模型的價格終歸會達到一個合理的水平。
大模型是否是通往AGI的基石:大家所存在的共識與非共識。
除了對于降價潮這樣的“周邊問題”表達看法,對于“大模型是否是通往AGI之路的基石”這一熱點話題,四位掌舵人也給出了自己的看法和觀點。
月之暗面的楊植麟認為,大模型的第一性原理,就是要不斷提升模型的規模。這件事從本質上來說,是在做壓縮,壓縮就會產生智能。當然,這個過程會面臨很多的挑戰,諸如數據流失,某些領域的數據資料較為稀缺等。由此可見,數據是當前存在的最大的問題和變量,而規模定律或大模型本身并沒有什么問題。
楊植麟還表示,“如何定義AGI”這件事至關重要,但不必急于現在就給出一個精確量化的定義。AGI可能更多地是一種定性的概念,一種感覺上的共識。其核心作用在于,能夠使社會和個人對未來可能發生的變化有所準備。畢竟,這項技術的發展速度可能異常迅猛。
百川智能的王小川則認為,“基石”這個詞是沒有問題的,但它只是在逼近AGI。從根本上說,這需要一個范式的轉變,而今天大家看到的規模定律的成效只是邁出的第一步。王小川認為,從某種程度上說,我們目前已經進入了AGI的時代,這個時代有能力吸引更多的科學家和資源,共同邁向AGI。但僅憑目前公開的規模定律無法完全實現AGI, 光靠Scaling Law,也是做不到AGI的。
智譜AI的張鵬則肯定大模型是基石之一。他認為,當下人工智能的從業者很“實用主義”,大家都十分關心到底能不能真正的解決問題,到底能不能真的向每個人心中定義的AGI路徑上進行推動。目前來說,Scaling Law還在生效,還在往前前進,大模型也依然在很有效地推進。但說到未來能否真的幫助人們到達頂峰,尚未可知。
或許是因為面壁智能的李大海出自數學專業,他的表達較為嚴謹。他表示,大模型一定是當前所有技術里,可以在通往AGI這個方向上走得最遠的,但它能否直達,現在來看還有很多未知因素。李大海表示,“聯想到《思考:快與慢》的觀點,人腦有兩個系統:快速直觀的感性思考與慢速細致的理性思考。現在的云端大模型主要是在處理人的大腦系統,一是“快思考”的工作;二是“慢思考”的系統,即要做各種各樣推理,搜索空間去做搜索,組合,從而來完成一個任務”。
想要實現“慢思考”的能力,需要大模型通過Agent技術外部化或者把它內化為自己的能力,抑或通過端側大模型的部署來實現。未來的大模型是否有這樣的能力?這需要大家去進行進一步的探索。
由此可見,在短期內對對AGI的進展進行評估,會是一個極具挑戰性的問題。
大模型是否應該開源?大家普遍共識:開源并不會削弱競爭力。
近期斯坦福的三位學生抄襲面壁智能MiniCPM大模型的事件正鬧的沸沸揚揚,而面壁智能的李大海也在會上首次公開做出了回應。他表示,“我們完全沒有想到我們的工作會以這種方式出圈,挺惶恐的”。
這個具體事件要追溯到5月20日,面壁智能開源了MiniCPM大模型之后。5月29日,三位斯坦福的本科生在該模型基礎上做了非常簡單的高斯疊加,就號稱是自己的模型。這個模型一下子變得很受歡迎,因為該團隊宣稱這個模型的多模態能力跟GPT4-V完全對標,但是參數只有后者的1%,并且只需要500美金就能夠訓練出來。
事件發生僅僅過了一天,開元社區的熱心參與者便發現了事情的真相,并將此曝光。
在大會上,李大海對于這一事件進行了表態。他表示,3位本科生所提到的“模型的多模態能力跟GPT4-V完全對標,但是參數只有后者的1%”是真實的,面壁智能確實具備這樣的實力,但其耗費的成本遠遠不止500美金,其實是需要花很多錢的。李大海認為,這件事讓面壁智能更加堅定了開源的力量。開源力量很強大,不光有做原創工作的人,還有很參與者貢獻需求,貢獻反饋,這也是開源生態重要組成部分。持續做開源貢獻,勢必能夠給公司帶來正向收益。
百川智能同樣是開源的參與者,王小川解釋了開源的動機:“第一,開源在市場上有這個需求,2023年6月開源了第一版,9月份開源了第二版。去年,中國對大模型充滿熱情與緊迫感,開源策略在市場上產生了積極影響。作為認真開源的商業化廠商,百川獲得了市場的認可,這對我們來說是一個巨大的鼓舞,無論是在人才儲備還是資本關注方面,都為行業樹立了標桿。第二,開源也體現了一種心態。我們認識到模型的快速迭代,今天的領先并不意味著明天的競爭力。因此,開源并沒有削弱我們的商業競爭力”。更重要的是,眾多公司參與開源,共同推動中國生態追趕美國,保護知識產權,這會使整個生態持續繁榮的發展。
四家獨角獸大模型公司的同臺是具有極其重要的意義的,這不僅體現了行業內的合作精神和開放交流的態度,也會推動整個行業的發展和創新。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)