新火種AI|微軟扶持下一個OpenAI?Mistral AI新模型對標GPT-4
作者:一號
編輯:美美
OpenAI的大金主微軟,還想締造“下一個OpenAI”。
周一晚間,成立僅9個月的Mistral AI正式發(fā)布了最強力的旗艦?zāi)P蚆istral Large。和此前他們所推出的一系列模型不同,Mistral AI本次發(fā)布的版本性能更強,體量也更大,直接對標OpenAI的GPT-4。
在目前所有能夠通過API訪問的大模型中,Mistral Large排名第二,僅次于“當紅明星”GPT-4,并且和GPT-4一樣,是唯二在MMLU考試中拿到了80分以上的。
而且隨著Mistral Large上線,Mistral AI還推出了名為Le Chat的聊天機器人,對標ChatGPT,大有復制OpenAI成功道路的意圖。即便有微軟Azure算力資源的加持,Le Chat的服務(wù)器還是被擠爆了。
忘了初心,開源變閉源?
早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因為其強大的性能,還有令人意外的開源而名噪一時。使得不少的大模型初創(chuàng)企業(yè)不再對標Llama2這個開源模型,而是轉(zhuǎn)而將Mistral旗下的模型作為直接競爭對手。這一次Mistral Large的橫空出世,自然引人注目。
從性能上來說,盡管Mistral Large在參數(shù)量上還比不上GPT-4,但在一些關(guān)鍵性能上,它還是能夠和GPT-4一戰(zhàn)的,可以說,已經(jīng)是當前業(yè)內(nèi)前三的地位。
在推理準確性上,Mistral Large也已經(jīng)超過了Claude 2、Gemini 1.0 Pro、GPT-3.5等一眾為人所熟知的大模型,并且它還支持32k token的上下文窗口,支持精確指令,自帶函數(shù)調(diào)用能力。在推理速度上,Mistral Large甚至還超過了GPT-4還有谷歌剛推出不久的Gemini Pro。
但有眼尖的網(wǎng)友發(fā)現(xiàn),Mistral修改了網(wǎng)站內(nèi)容,刪除了所有提及開源社區(qū)義務(wù)的內(nèi)容,這讓不少開源大模型愛好者開始擔心,Mistral AI也會像OpenAI一樣,從開放走向封閉。
不過據(jù)媒體對Mistral CEO的采訪,未來他們依舊會堅持開源理念,但與此同時,也會推出性能最為強大的閉源模型來參與商業(yè)競爭。
從誕生之初,就充滿傳奇光環(huán)
誰能想到,今天這個逼近GPT-4的模型,是來自一家僅僅成立9個月的法國公司。
Mistral AI的創(chuàng)始人Arthur Mensch在1993年時出生于法國。在巴黎綜合理工學院和巴黎高等師范學院學習期間,他結(jié)識了后來成為Mistral AI聯(lián)合創(chuàng)始人的Timothée Lacroix和Guillaume Lample。而后兩位都曾在Meta AI團隊工作過,其中Lample還領(lǐng)導了LLaMA模型的開發(fā)。在那時,全球范圍內(nèi)具備構(gòu)建、訓練和優(yōu)化大型語言模型(LLM)專業(yè)經(jīng)驗的人才不超過100人。
Arthur Mensch本人也頗有實力。他在2020年初便加入了谷歌,成為了DeepMind的研究員,專注于提高AI和機器學習系統(tǒng)的效率。在那里,他參與開發(fā)了大型語言模型,并以主要作者的身份發(fā)表了著名的“Chinchilla論文”,該研究重新定義了人們對AI模型大小、訓練數(shù)據(jù)量及其性能之間關(guān)系的認識。
然而隨著AI競賽的升溫,Mensch對于大公司AI實驗室減少與研究社區(qū)分享研究成果的做法感到失望。他所在的團隊從一個10人的小團隊迅速擴大到70人的大團隊,但他覺得在大型科技公司中開發(fā)不透明的技術(shù)過于官僚化,于是決定離開。
2023年初,他離開了谷歌,和前文所提到的Lacroix和Lample一起創(chuàng)立了Mistral AI。他們的目標是通過更加高效的方法構(gòu)建和部署AI模型,并堅持開源模型的原則,希望讓每個人對自己使用的AI有更多的控制權(quán)。
在種子輪融資時,Mistral AI的故事更具傳奇色彩:一個6人團隊憑借著7頁PPT就拿到了8億歐元的融資。而當前公司的估值已經(jīng)達到了20億美元,漲了七倍多。盡管與美國的競爭者相比,所獲得的資金并不算多,但他們的目標是成為AI領(lǐng)域中最節(jié)省資本的公司。
微軟想要打造下一個OpenAI?
在Mistral Large以令人驚喜的性能收獲目光之時,微軟CEO納德拉宣布,微軟已經(jīng)和Mistral AI建立了多年合作伙伴關(guān)系。這也是微軟繼OpenAI之后,又再一次地把“真金白銀”投給了AI圈的另一家頂流模型公司。
人們不禁懷疑,微軟這是想要打造“下一個OpenAI”?
根據(jù)公告,微軟和Mistral AI的合作將集中在以下三個關(guān)鍵領(lǐng)域:
超算基礎(chǔ)結(jié)構(gòu):微軟將通過Azure AI超算基礎(chǔ)結(jié)構(gòu)支持Mistral AI,用于AI訓練和推理工作負載。
擴展市場:微軟和 Mistral AI 將通過 Azure AI Studio 和 Azure 機器學習模型目錄中的模型即服務(wù)(MaaS)向客戶提供 Mistral AI 的高級模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業(yè)模型。
人工智能研發(fā):微軟和 Mistral AI 將探索為特定客戶訓練特定目的模型的合作。
毫無疑問,除了OpenAI之外,微軟還想給自己的Azure云服務(wù)吸引更多客戶。并且,微軟兩頭下注,實際上很可能是想要分散風險,并且期望獲得更大的影響力。
去年11月,OpenAI經(jīng)歷了CEO奧特曼被解雇而后又重返的董事會風波。而作為OpenAI的最大股東,微軟直到消息公布之前的5到10分鐘才從OpenAI那里得到消息。盡管在這場風波之后,微軟設(shè)法在控制 OpenAI 的非營利性董事會中獲得了一個無投票權(quán)的觀察員席位,這讓他們對OpenAI的內(nèi)部運作有了更多的了解,但在一些重大決策上,微軟依舊沒有投票權(quán)。
微軟作為OpenAI的最大金主,顯然沒在OpenAI的決策上取得與之相對應(yīng)的影響力。因此,微軟想要扶持另一家能夠與OpenAI對位的企業(yè)也是情理之中。
這一點,在路透社對Mistral AI的采訪中也得到了體現(xiàn),Mistral AI承認,作為交易的一部分,微軟將持有該公司少數(shù)股權(quán),但并沒有透露更多細節(jié)。而微軟這邊則僅僅是證實了其對Mistral的投資,在是否持有該公司股權(quán)的問題上,微軟給出了否定的回答。而這很可能與微軟因向OpenAI提供了巨額資金而受到歐洲和美國監(jiān)管機構(gòu)的審查有關(guān)。
另外,由于Mistral AI是一家法國公司,在語言支持上也更加偏向于歐洲本土語言,因此微軟投資Mistral AI也是想要在歐洲建立起自己的AI影響力,在歐洲AI領(lǐng)域站穩(wěn)腳跟。
與美國不同,歐洲許多國家對AI的態(tài)度偏保守,持批判性看法,尤其是數(shù)據(jù)保護方面。因此投資一家歐洲本土的AI企業(yè),打造一家“歐洲版OpenAI”,也許能夠更讓人放心。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)