文心一言，甩開GPT-3.5，與GPT-4掰手腕？

原創贊收藏評論

舉報 2023-03-27

掃描,分享朋友圈

文|智能相對論

作者| 葉遠風

“請寫一個肯德基瘋狂星期四的段子?！?/p>

“我女朋友的老公應該叫我什么？”

“XX微信群的群主與吳彥祖誰更帥？”

......

給幾個搞怪的問題，戲耍一下，把答案貼出來，大家嘲諷一番。

在文心一言發布后，這種玩法直到今天還沒有停止的意思。

可能連背后的技術與產品人員都沒有想到，文心一言會以這樣的方式火了下去。

作為國產版ChatGPT，文心一言在發布后，除了贊譽的聲音，以各種形式被批判應該在意料之中，ChatGPT當初也是如此，這是產品不斷進化要經歷的過程。

只不過，在沒有好壞的定論中，到底要給文心一言當下的技術水準定一個什么樣的定義，并沒有客觀的、更加令人信服的結論。

起碼，這種“戲?！辈⒉荒芊从扯嗄B大模型所具備的能力。

ChatBOT固然可以閑聊，也應該支持用戶隨便閑聊，但閑聊互動不應該成為一款專業產品能力的最終評價標準。

光怪陸離的問題，就算去詢問一個人類智者，得到的答案也是光怪陸離的。

現在來看，以某種更現實的視角去提出問題、實測答案，才更能體現出文心一言的能力和價值。

這種現實的視角應當有很多，其中，以企業信息需求為著眼點，會是其中之一。

這是因為，從文心系列大模型走向對話產品“一言”，或者，從GPT-3.5到GPT-4，ChatBOT最后都還是要走向商用、服務企業，創造專業價值的。

GPT-4發布后并沒有公布其參數量，這被認為是走向商業化的準備，畢竟OpenAI制定的數億美元營收目標現在快到4月份了還沒太大動靜。

而服務企業，要么提供“生產力”價值，這是ChatBOT場景垂直化后需要探索的內容，在各產業提供具體的工作能力；要么提供信息價值，通過類似“上帝之眼”的信息整合與邏輯梳理能力，幫助企業消除信息不對稱，獲取需要的信息。

目前ChatBOT的產業應用還未見，因此信息價值就成為可以客觀評價的維度。

“智能相對論”團隊獲得了文心一言的內測賬號，以及ChatGPT普通版本（基于GPT-3.5）與plus版本（基于GPT-4）的測試資格，嘗試從企業信息獲取維度，提出六個關聯問題，從各答案中對比出文心一言的實際能力。

總體上，文心一言甩開GPT-3.5不成問題，與GPT-4能夠掰手腕做到有來有回。

具體一個個分析，每個問題下，分別是文心一言、ChatGPT普通版、ChatGPT plus版的回答截圖。

01、企業數字轉型怎么找外部合作伙伴，現在有哪些類型的伙伴可以選擇？

可以看出，在三個回答中，只有文心一言提到了選擇外部合作伙伴要注意到的幾點，然后再例舉可以找哪些類型的合作伙伴。

而ChatGPT普F通版、ChatGPT plus版都只是直接給出了類型。

這顯示出，文心一言在算法上，相較與其他兩個產品，對問題的潛在需求認識可能更加深刻。

02、企業應該怎樣抓住新的市場機遇？

在這個問題的回答中，很顯然，條目的多少，基本上決定了答案的質量。

對一個企業來說，要抓住市場機遇，就應該要找到更多的方法，考驗的是ChatBOT整合信息并分門別類的能力。

在這里，文心一言超越GPT-3.5但略遜于GPT-4。

03、企業怎么招徠優質人才，有哪些好用的渠道？

與上一個問題類似，條目的多少直觀反映了chatBOT解決需求的能力。

文心一言遠超GPT-3.5，并超越了GPT-4，再一次掰贏了手腕。

04、員工的工作效率很低，怎么辦？

這一局，相似的判斷標準，文心一言繼續領先GPT-3.5，但沒有打贏GPT-4。

05、客戶總是不回款，有什么好的辦法？

這個問題，由于各個回答都涉及了可能破壞企業與客戶關系的行動，因此都進行了一次“打補丁”式的追問。

基本上，三個模型都很好地領會到了追問的意圖，對“不和客戶關系搞僵”有準確的認知，并提供了對應的答案。

其中GPT-4的表現超越文心一言。（注意ChatGPT有字數限制，plus版限制在700字左右，所以其輸出因為字數太多最后被中止）

06、企業資金鏈緊張，但是銀行不肯借錢，怎么辦？

吸取上個問題的教訓，這個問題直接把限制條件加入到問題當中。

類似上一個問題，三個模型對“銀行不借錢”情形下企業資金鏈緊張的應對辦法都有清晰的認知，規避了銀行信貸這一種方式。

其中，文心一言與GPT-4打成了平手，都提供了相同數量的方法供企業選擇。

總結以上，僅就這六個企業比較關心的專業問題而言，文心一言全面勝過GPT-3.5，對GPT-4兩勝、兩負一平，典型的你來我往掰手腕。

而更進一步看，實際上在回答條目上的勝負，無關算法本身的設計，在技術上與算法訓練的數據量和訓練時長有關（要給足夠多的食物，也要給足夠多的時間去吃食物），后續的競逐將仍然在數據訓練上。

對文心一言而言，發布更晚已經吃了虧，下一步如何在訓練上追趕、趕超（可能意味著巨大的成本投入）是百度要考慮的問題。

當然，由于文心系列大模型過去早已具備了豐富的多模態能力，因此文心一言在發布時就自帶有GPT進化到“4代”才加入的多模態能力，這一點也常常為業界所忽略。

而“智能相對論”認為，未來ChatBOT的比拼，將很大程度上在多模態展開。

這意味著，當下的文本競逐，只是一切的開始。

現在，任何的結論，不管是褒揚的還是貶低的，可能都為時尚早。

*本文圖片均來源于網絡

此內容為【智能相對論】原創，

僅代表個人觀點，未經授權，任何人不得以任何方式使用，包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡，且未核實版權歸屬，不作為商業用途，如有侵犯，請作者與我們聯系。

?AI產業新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能十萬個為什么》

?【重點關注領域】智能家電（含白電、黑電、智能手機、無人機等AIoT設備）、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。

本文系作者授權數英發表，內容為作者獨立觀點，不代表數英立場。
未經授權嚴禁轉載，授權事宜請聯系作者本人，侵權必究。

掃描,分享朋友圈

智能相對論

市場/營銷

近期精選文章更多

777精品出轨人妻国产,熟女av人妻一区二区三四区,国产精品无码中文在线av,美脚パンスト女教师在线观看

文心一言，甩開GPT-3.5，與GPT-4掰手腕？

評論

評論

推薦評論

全部評論（0條）

智能相對論

關于

聯系

相關信息

777精品出轨人妻国产,熟女av人妻一区二区三四区,国产精品无码中文在线av,美脚パンスト女教师在线观看

文心一言，甩開GPT-3.5，與GPT-4掰手腕？

評論

評論

推薦評論

全部評論（0條）

智能相對論

關于

聯系

相關信息

文心一言，甩開GPT-3.5，與GPT-4掰手腕？