新火種AI|實屬罕見！四大AI頂流同臺，有哪些關鍵信息值得關注？

原創贊收藏評論

舉報 2024-06-19

掃描,分享朋友圈

作者：小巖

編輯：彩云

在有著“AI春晚”之稱的2024年智源大會上，非常難得的一幕出現了：當下國內的四大AI頂流公司——月之暗面，百川智能，智譜AI，面壁智能齊聚一堂，十分罕見的同臺了。

從體量上來說，四家大模型公司都稱得上是獨角獸級別，它們的創始人聚在一起，分享各自對大模型未來的觀點和看法，這對于整個行業來說，無疑是值得標記的一筆。

有意思的是，這四家大模型獨角獸掌舵人——百川智能的CEO王小川，智譜AI CEO張鵬，月之暗面CEO楊植麟以及面壁智能聯合創始人，CEO李大海都出身于清華，是名副其實的師出同門。

圖片1.png

關于價格，安全等話題：四家獨角獸給出的答案各有側重。

在智源大會上，四位出身于清華的大模型獨角獸掌舵人一同出席了《尖峰對話：通往AGI之路》環節。

在對話中，大家對于大模型的價格戰問題表達了自己的看法。王小川就公開表示，價格戰對于中國發展大模型是特別好的事，自己也是積極看待的。目前打響的大模型價格戰，主要是云廠商之間的競爭。包括火山引擎，阿里云，騰訊云，百度云等。

可在此之前，王小川是旗幟鮮明的反對價格戰的，表示這是巨頭間的游戲，百川智能不愿意摻和進去。

其實王小川先前的想法并非個例。零一萬物創始人李開復也在大會別的環節上表示，當下AI市場存在一個比較嚴重的問題，就是很多大公司沒有認識到軟件的價值，不愿意為軟件付費。結果很多大模型公司來競標，結果卻是越競越低，做到最后做一單賠一單，沒有利潤。也正因此，他認為，零一萬物堅決做to C，不做“賠錢的to B”。而智源研究院的院長王仲遠也認為，當下選擇大模型優先考慮的肯定不是性價比，而是能否真正為自己的產品賦能。在此基礎之上，大模型的價格終歸會達到一個合理的水平。

大模型是否是通往AGI的基石：大家所存在的共識與非共識。

除了對于降價潮這樣的“周邊問題”表達看法，對于“大模型是否是通往AGI之路的基石”這一熱點話題，四位掌舵人也給出了自己的看法和觀點。

圖片2.png

月之暗面的楊植麟認為，大模型的第一性原理，就是要不斷提升模型的規模。這件事從本質上來說，是在做壓縮，壓縮就會產生智能。當然，這個過程會面臨很多的挑戰，諸如數據流失，某些領域的數據資料較為稀缺等。由此可見，數據是當前存在的最大的問題和變量，而規模定律或大模型本身并沒有什么問題。

楊植麟還表示，“如何定義AGI”這件事至關重要，但不必急于現在就給出一個精確量化的定義。AGI可能更多地是一種定性的概念，一種感覺上的共識。其核心作用在于，能夠使社會和個人對未來可能發生的變化有所準備。畢竟，這項技術的發展速度可能異常迅猛。

百川智能的王小川則認為，“基石”這個詞是沒有問題的，但它只是在逼近AGI。從根本上說，這需要一個范式的轉變，而今天大家看到的規模定律的成效只是邁出的第一步。王小川認為，從某種程度上說，我們目前已經進入了AGI的時代，這個時代有能力吸引更多的科學家和資源，共同邁向AGI。但僅憑目前公開的規模定律無法完全實現AGI，光靠Scaling Law，也是做不到AGI的。

智譜AI的張鵬則肯定大模型是基石之一。他認為，當下人工智能的從業者很“實用主義”，大家都十分關心到底能不能真正的解決問題，到底能不能真的向每個人心中定義的AGI路徑上進行推動。目前來說，Scaling Law還在生效，還在往前前進，大模型也依然在很有效地推進。但說到未來能否真的幫助人們到達頂峰，尚未可知。

或許是因為面壁智能的李大海出自數學專業，他的表達較為嚴謹。他表示，大模型一定是當前所有技術里，可以在通往AGI這個方向上走得最遠的，但它能否直達，現在來看還有很多未知因素。李大海表示，“聯想到《思考：快與慢》的觀點，人腦有兩個系統：快速直觀的感性思考與慢速細致的理性思考。現在的云端大模型主要是在處理人的大腦系統，一是“快思考”的工作；二是“慢思考”的系統，即要做各種各樣推理，搜索空間去做搜索，組合，從而來完成一個任務”。

想要實現“慢思考”的能力，需要大模型通過Agent技術外部化或者把它內化為自己的能力，抑或通過端側大模型的部署來實現。未來的大模型是否有這樣的能力？這需要大家去進行進一步的探索。

圖片3.png

由此可見，在短期內對對AGI的進展進行評估，會是一個極具挑戰性的問題。

大模型是否應該開源？大家普遍共識：開源并不會削弱競爭力。

近期斯坦福的三位學生抄襲面壁智能MiniCPM大模型的事件正鬧的沸沸揚揚，而面壁智能的李大海也在會上首次公開做出了回應。他表示，“我們完全沒有想到我們的工作會以這種方式出圈，挺惶恐的”。

圖片4.png

這個具體事件要追溯到5月20日，面壁智能開源了MiniCPM大模型之后。5月29日，三位斯坦福的本科生在該模型基礎上做了非常簡單的高斯疊加，就號稱是自己的模型。這個模型一下子變得很受歡迎，因為該團隊宣稱這個模型的多模態能力跟GPT4-V完全對標，但是參數只有后者的1%，并且只需要500美金就能夠訓練出來。

事件發生僅僅過了一天，開元社區的熱心參與者便發現了事情的真相，并將此曝光。

圖片6.png

在大會上，李大海對于這一事件進行了表態。他表示，3位本科生所提到的“模型的多模態能力跟GPT4-V完全對標，但是參數只有后者的1%”是真實的，面壁智能確實具備這樣的實力，但其耗費的成本遠遠不止500美金，其實是需要花很多錢的。李大海認為，這件事讓面壁智能更加堅定了開源的力量。開源力量很強大，不光有做原創工作的人，還有很參與者貢獻需求，貢獻反饋，這也是開源生態重要組成部分。持續做開源貢獻，勢必能夠給公司帶來正向收益。

百川智能同樣是開源的參與者，王小川解釋了開源的動機：“第一，開源在市場上有這個需求，2023年6月開源了第一版，9月份開源了第二版。去年，中國對大模型充滿熱情與緊迫感，開源策略在市場上產生了積極影響。作為認真開源的商業化廠商，百川獲得了市場的認可，這對我們來說是一個巨大的鼓舞，無論是在人才儲備還是資本關注方面，都為行業樹立了標桿。第二，開源也體現了一種心態。我們認識到模型的快速迭代，今天的領先并不意味著明天的競爭力。因此，開源并沒有削弱我們的商業競爭力”。更重要的是，眾多公司參與開源，共同推動中國生態追趕美國，保護知識產權，這會使整個生態持續繁榮的發展。

四家獨角獸大模型公司的同臺是具有極其重要的意義的，這不僅體現了行業內的合作精神和開放交流的態度，也會推動整個行業的發展和創新。

本文系作者授權數英發表，內容為作者獨立觀點，不代表數英立場。
未經授權嚴禁轉載，授權事宜請聯系作者本人，侵權必究。