新火種AI|微軟扶持下一個OpenAI？Mistral AI新模型對標(biāo)GPT-4

原創(chuàng) 贊收藏評論

舉報 2024-02-27

掃描,分享朋友圈

作者：一號

編輯：美美

OpenAI的大金主微軟，還想締造“下一個OpenAI”。

周一晚間，成立僅9個月的Mistral AI正式發(fā)布了最強力的旗艦?zāi)Ｐ蚆istral Large。和此前他們所推出的一系列模型不同，Mistral AI本次發(fā)布的版本性能更強，體量也更大，直接對標(biāo)OpenAI的GPT-4。

在目前所有能夠通過API訪問的大模型中，Mistral Large排名第二，僅次于“當(dāng)紅明星”GPT-4，并且和GPT-4一樣，是唯二在MMLU考試中拿到了80分以上的。

而且隨著Mistral Large上線，Mistral AI還推出了名為Le Chat的聊天機器人，對標(biāo)ChatGPT，大有復(fù)制OpenAI成功道路的意圖。即便有微軟Azure算力資源的加持，Le Chat的服務(wù)器還是被擠爆了。

忘了初心，開源變閉源？

早在本次Mistral Large“炸街”之前，Mistral AI所提出的Mistral-Medium就因為其強大的性能，還有令人意外的開源而名噪一時。使得不少的大模型初創(chuàng)企業(yè)不再對標(biāo)Llama2這個開源模型，而是轉(zhuǎn)而將Mistral旗下的模型作為直接競爭對手。這一次Mistral Large的橫空出世，自然引人注目。

從性能上來說，盡管Mistral Large在參數(shù)量上還比不上GPT-4，但在一些關(guān)鍵性能上，它還是能夠和GPT-4一戰(zhàn)的，可以說，已經(jīng)是當(dāng)前業(yè)內(nèi)前三的地位。

在推理準(zhǔn)確性上，Mistral Large也已經(jīng)超過了Claude 2、Gemini 1.0 Pro、GPT-3.5等一眾為人所熟知的大模型，并且它還支持32k token的上下文窗口，支持精確指令，自帶函數(shù)調(diào)用能力。在推理速度上，Mistral Large甚至還超過了GPT-4還有谷歌剛推出不久的Gemini Pro。

但有眼尖的網(wǎng)友發(fā)現(xiàn)，Mistral修改了網(wǎng)站內(nèi)容，刪除了所有提及開源社區(qū)義務(wù)的內(nèi)容，這讓不少開源大模型愛好者開始擔(dān)心，Mistral AI也會像OpenAI一樣，從開放走向封閉。

不過據(jù)媒體對Mistral CEO的采訪，未來他們依舊會堅持開源理念，但與此同時，也會推出性能最為強大的閉源模型來參與商業(yè)競爭。

從誕生之初，就充滿傳奇光環(huán)

誰能想到，今天這個逼近GPT-4的模型，是來自一家僅僅成立9個月的法國公司。

Mistral AI的創(chuàng)始人Arthur Mensch在1993年時出生于法國。在巴黎綜合理工學(xué)院和巴黎高等師范學(xué)院學(xué)習(xí)期間，他結(jié)識了后來成為Mistral AI聯(lián)合創(chuàng)始人的Timothée Lacroix和Guillaume Lample。而后兩位都曾在Meta AI團隊工作過，其中Lample還領(lǐng)導(dǎo)了LLaMA模型的開發(fā)。在那時，全球范圍內(nèi)具備構(gòu)建、訓(xùn)練和優(yōu)化大型語言模型（LLM）專業(yè)經(jīng)驗的人才不超過100人。

Arthur Mensch本人也頗有實力。他在2020年初便加入了谷歌，成為了DeepMind的研究員，專注于提高AI和機器學(xué)習(xí)系統(tǒng)的效率。在那里，他參與開發(fā)了大型語言模型，并以主要作者的身份發(fā)表了著名的“Chinchilla論文”，該研究重新定義了人們對AI模型大小、訓(xùn)練數(shù)據(jù)量及其性能之間關(guān)系的認識。

然而隨著AI競賽的升溫，Mensch對于大公司AI實驗室減少與研究社區(qū)分享研究成果的做法感到失望。他所在的團隊從一個10人的小團隊迅速擴大到70人的大團隊，但他覺得在大型科技公司中開發(fā)不透明的技術(shù)過于官僚化，于是決定離開。

2023年初，他離開了谷歌，和前文所提到的Lacroix和Lample一起創(chuàng)立了Mistral AI。他們的目標(biāo)是通過更加高效的方法構(gòu)建和部署AI模型，并堅持開源模型的原則，希望讓每個人對自己使用的AI有更多的控制權(quán)。

在種子輪融資時，Mistral AI的故事更具傳奇色彩：一個6人團隊?wèi){借著7頁PPT就拿到了8億歐元的融資。而當(dāng)前公司的估值已經(jīng)達到了20億美元，漲了七倍多。盡管與美國的競爭者相比，所獲得的資金并不算多，但他們的目標(biāo)是成為AI領(lǐng)域中最節(jié)省資本的公司。

微軟想要打造下一個OpenAI？

在Mistral Large以令人驚喜的性能收獲目光之時，微軟CEO納德拉宣布，微軟已經(jīng)和Mistral AI建立了多年合作伙伴關(guān)系。這也是微軟繼OpenAI之后，又再一次地把“真金白銀”投給了AI圈的另一家頂流模型公司。

人們不禁懷疑，微軟這是想要打造“下一個OpenAI”？

根據(jù)公告，微軟和Mistral AI的合作將集中在以下三個關(guān)鍵領(lǐng)域：

超算基礎(chǔ)結(jié)構(gòu)：微軟將通過Azure AI超算基礎(chǔ)結(jié)構(gòu)支持Mistral AI，用于AI訓(xùn)練和推理工作負載。

擴展市場：微軟和 Mistral AI 將通過 Azure AI Studio 和 Azure 機器學(xué)習(xí)模型目錄中的模型即服務(wù)（MaaS）向客戶提供 Mistral AI 的高級模型。除 OpenAI 模型外，模型目錄還提供了多種開源和商業(yè)模型。

人工智能研發(fā)：微軟和 Mistral AI 將探索為特定客戶訓(xùn)練特定目的模型的合作。

毫無疑問，除了OpenAI之外，微軟還想給自己的Azure云服務(wù)吸引更多客戶。并且，微軟兩頭下注，實際上很可能是想要分散風(fēng)險，并且期望獲得更大的影響力。

去年11月，OpenAI經(jīng)歷了CEO奧特曼被解雇而后又重返的董事會風(fēng)波。而作為OpenAI的最大股東，微軟直到消息公布之前的5到10分鐘才從OpenAI那里得到消息。盡管在這場風(fēng)波之后，微軟設(shè)法在控制 OpenAI 的非營利性董事會中獲得了一個無投票權(quán)的觀察員席位，這讓他們對OpenAI的內(nèi)部運作有了更多的了解，但在一些重大決策上，微軟依舊沒有投票權(quán)。

微軟作為OpenAI的最大金主，顯然沒在OpenAI的決策上取得與之相對應(yīng)的影響力。因此，微軟想要扶持另一家能夠與OpenAI對位的企業(yè)也是情理之中。

這一點，在路透社對Mistral AI的采訪中也得到了體現(xiàn)，Mistral AI承認，作為交易的一部分，微軟將持有該公司少數(shù)股權(quán)，但并沒有透露更多細節(jié)。而微軟這邊則僅僅是證實了其對Mistral的投資，在是否持有該公司股權(quán)的問題上，微軟給出了否定的回答。而這很可能與微軟因向OpenAI提供了巨額資金而受到歐洲和美國監(jiān)管機構(gòu)的審查有關(guān)。

另外，由于Mistral AI是一家法國公司，在語言支持上也更加偏向于歐洲本土語言，因此微軟投資Mistral AI也是想要在歐洲建立起自己的AI影響力，在歐洲AI領(lǐng)域站穩(wěn)腳跟。

與美國不同，歐洲許多國家對AI的態(tài)度偏保守，持批判性看法，尤其是數(shù)據(jù)保護方面。因此投資一家歐洲本土的AI企業(yè)，打造一家“歐洲版OpenAI”，也許能夠更讓人放心。

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨立觀點，不代表數(shù)英立場。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載，授權(quán)事宜請聯(lián)系作者本人，侵權(quán)必究。