測評(píng)5個(gè)最火大模型,總結(jié)出一份實(shí)用操作攻略
內(nèi)容作者:小小,編輯:鄭晶敏
原標(biāo)題:測評(píng)了5個(gè)最火大模型,我破解了AI人格密碼(附攻略)
過去一個(gè)月,相信很多創(chuàng)作者的工作流已被AI部分接管:
寫稿卡殼時(shí)找DeepSeek發(fā)散腦洞,查資料時(shí)使喚Kimi跑腿,做PPT時(shí)抓豆包渲染圖片。
用久了就會(huì)發(fā)現(xiàn),這些AI不僅僅是工具,而更像一群性格各異的實(shí)習(xí)生——
有人精于抖機(jī)靈但滿嘴跑火車,有人悶頭干活但毫無情趣,還有人試圖用高情商話術(shù)掩蓋邏輯漏洞。
“確診為DeepSeek人格”之類的話題也一度讓網(wǎng)友們玩梗。
網(wǎng)友們把自己代入各種AI,重新定義“16型人格”,比如“很聰明但不干活”的DeepSeek型人格,“有點(diǎn)笨但特別勤奮”的豆包型人格,“海歸留子你用不起”的ChatGPT型人格……
最近OpenAI推出的GPT-4.5更是“人格”鮮明。
繼DeepSeek的推理“魔法”、Grok-3的算力“武器”之后,GPT-4.5展現(xiàn)了一種“高情商AI”的范式。
當(dāng)AI們側(cè)重的能力維度越來越多樣,它們各自的人格也就越來越鮮明。
我們通過測評(píng),總結(jié)出以下“AI人格圖譜”以及創(chuàng)作者使用攻略。
01 GPT-4.5 :優(yōu)雅的高情商人生導(dǎo)師
如果給GPT-4.5貼一張人格標(biāo)簽,它大概率是“一線城市中產(chǎn)最愛的心理咨詢師”——穿著亞麻襯衫,說話溫和克制,總能從你的抱怨中提煉出“自我價(jià)值重構(gòu)建議”;
但上千元/小時(shí)的咨詢費(fèi),又讓人忍不住懷疑它華而不實(shí):“這些共情話術(shù),到底值不值這個(gè)價(jià)?”
高情商和超昂貴,就是GPT-4.5最顯著的特點(diǎn)。
GPT-4.5推出時(shí),山姆·奧特曼稱這是讓他“第一次感覺像和一個(gè)有思想的人聊天”的模型,他震驚于居然真的能從AI那兒獲得不錯(cuò)的建議。
有用戶實(shí)測后也發(fā)現(xiàn),相較于其他AI,與GPT-4.5的對話體驗(yàn)更近似于人類的溝通和情感表達(dá)模式。
比如,當(dāng)用戶表示自己失戀時(shí),其他AI會(huì)直接給出大量行動(dòng)建議,而GPT-4.5則是回復(fù)“想聊聊你們的故事嗎?”仿佛它和人類一樣有直覺,能夠和用戶感同身受。
同樣被認(rèn)為高情商的還有DeepSeek。
而GPT-4.5的優(yōu)勢在于,它更加循循善誘、春風(fēng)化雨,而不像DeepSeek喜歡“掉書袋子”、三句一比喻、五句一金句,似乎在共情用戶的同時(shí)還想考考用戶的閱讀量。
擅長情商并不意味著GPT-4.5降智了。
事實(shí)上,GPT-4.5的幻覺率從GPT-4o的61.8%降至37.1%。OpenAI研究員Mia Glaese對此表示,“如果你知道更多的事情,你就不需要編造東西”。
但這份優(yōu)雅的代價(jià)極其昂貴。
GPT-4.5的API輸出價(jià)格達(dá)到每百萬tokens75美元,是DeepSeek優(yōu)惠時(shí)段的130倍。普通用戶的使用門檻也很高,奧特曼表示由于GPU不夠用,目前只有Pro用戶才可以使用,而Pro的月費(fèi)是200美元;本周將推廣到Plus用戶,月費(fèi)是20美元。
使用攻略:
1、情感咨詢、創(chuàng)意提案等“情緒溢價(jià)”場景才能值回票價(jià)。
2、用“我希望得到有溫度的回應(yīng)”觸發(fā)共情模式,用“請列舉可落地方案”關(guān)閉廢話模式
02 DeepSeek :慵懶的市井段子手哲學(xué)家
如果說GPT-4.5是CBD精英咖啡館里的心理咨詢師,DeepSeek就是混跡胡同口的熱心大爺。
它既能用土味段子逗樂,又能一針見血剖析社會(huì)現(xiàn)象,主打一個(gè)性價(jià)比與煙火氣。
每百萬tokens8元的標(biāo)準(zhǔn)價(jià),超高性價(jià)比讓DeepSeek成了不少中小企業(yè)和個(gè)體戶的賽博軍師。
對個(gè)人來說,它又是忠實(shí)耐心的朋友,以及永不枯竭的靈感永動(dòng)機(jī)。
而它的語言風(fēng)格,像極了互聯(lián)網(wǎng)時(shí)代的野生智慧:不端著、不完美,但足夠鮮活。
從它的文字里,總能看見一點(diǎn)貼吧、知乎、小紅書里高質(zhì)量網(wǎng)友的味道。就連它的幻覺和漏洞,都有一種荒誕的幽默感。
作為“員工”的DeepSeek,雖然便宜、實(shí)在,卻很挑活。
比如當(dāng)我提問其創(chuàng)始人的相關(guān)問題,它直接罷工:
還會(huì)隨時(shí)宕機(jī),在一眾勤奮的AI當(dāng)中,有著獨(dú)一份的慵懶:
使用攻略:
1、文字創(chuàng)作場景優(yōu)先使用DeepSeek,尤其是短視頻腳本、熱點(diǎn)評(píng)論等需要網(wǎng)感的領(lǐng)域,并容忍20%的胡扯,當(dāng)交“創(chuàng)意稅”。用5%的時(shí)間成本批量生成100條備選文案,人工篩選好過自己憋靈感。
2、涉及數(shù)字、學(xué)術(shù)概念時(shí),在提示詞中加一句“請用小學(xué)生能聽懂的話解釋”。
3、雖然DeepSeek本體比接入它的其他模型聰明,但建議同時(shí)開多個(gè)模型,以防它一言不合就罷工。
03 Grok-3 :大膽叛逆的天才高中生
算力投入炸裂的Grok-3,則像極了自詡“全校最聰明”的刺頭少年,熱衷標(biāo)新立異,但考試成績卻時(shí)常打臉。
消耗20萬塊GPU訓(xùn)練出來的Grok-3,在響應(yīng)速度上秒了不少AI工具。
當(dāng)我在等待其他AI回答的幾秒間隙,Grok-3可能已經(jīng)回答完了。讓我夢回學(xué)生時(shí)代的課堂上,當(dāng)大部分人還在費(fèi)勁理解老師的提問,總有學(xué)霸大聲喊出了答案。
這類學(xué)霸往往大膽而沒有邊界感。
Grok-3在小紅書等中文社交媒體上,最出圈的應(yīng)用是寫小黃文。當(dāng)其他AI都克制地限制用戶生成18禁內(nèi)容時(shí),用戶在Grok-3即使并非刻意,也會(huì)生成一堆大膽的圖片。
Grok-3推出時(shí),官方還將Grok-3可以處理敏感議題作為宣傳點(diǎn),比如倫理困境、政治爭議等。不過,官方給出的理由是,Grok-3有價(jià)值觀校準(zhǔn)機(jī)制,使回答保持開放,又不會(huì)走向極端。
Grok-3的缺乏邊界感,體現(xiàn)在它將X平臺(tái)的用戶數(shù)據(jù)用于模型訓(xùn)練。它對用戶隱私的漠視,讓不少用戶和隱私敏感行業(yè)集體抵制。
當(dāng)其他AI在內(nèi)容安全上一致謹(jǐn)慎,刺頭Grok-3似乎不那么在乎爭議,這像極了馬斯克本人。倒不如說,Grok-3最大的人格,或許就是馬斯克自己的人格。
使用攻略:
1、追國際熱點(diǎn)、玩梗吃瓜的一把好手。
2、用Grok-3寫文的“太太”們,建議用合規(guī)AI檢查一遍,降低風(fēng)險(xiǎn)。
3、用Grok-3抓取X平臺(tái)上的行業(yè)信息,有助于快速了解行業(yè)的海外實(shí)時(shí)動(dòng)態(tài)。????
04 豆包:貼心全能的社區(qū)大姐
如果AI工具圈是個(gè)小區(qū),多模態(tài)“雜活王”豆包就像常駐在萬能修補(bǔ)攤的大姐——裁褲腳、配鑰匙、修高壓鍋,收你五塊錢還附贈(zèng)一袋蔥。
沒有GPT-4.5的優(yōu)雅深邃,也學(xué)不會(huì)DeepSeek的瘋癲造梗,但豐富的能力,讓它成了學(xué)生黨、小店主、家庭主婦的“數(shù)字家政阿姨”——不驚艷,但管飽。
它的核心競爭力在于不挑活,雖然算不上“六邊形戰(zhàn)士”,
但至少真的有“六邊形”——寫作、修圖、做表、寫代碼、做PPT……雖然成品不建議細(xì)品,但不會(huì)出大問題,緊急時(shí)候夠交差。
當(dāng)它解決不了我的問題,則會(huì)補(bǔ)充一些別的資料,主打一個(gè)“不會(huì)寫也不能空著”的文科生思維。
看似有點(diǎn)笨,但情緒價(jià)值拉滿,就像班里那些平庸但能給老師安全感的學(xué)生。
使用攻略:
1、需要搜集國內(nèi)即時(shí)資訊時(shí),豆包比起以為自己還活在2023年的DeepSeek強(qiáng)得多。
2、工作以外的日常場景,豆包的語音交互可以讓AI使用體驗(yàn)更加絲滑,不需要斟酌提示詞。
05 Kimi:勤懇的學(xué)術(shù)極客研究員
Kimi則像實(shí)驗(yàn)室里的技術(shù)宅,癡迷長文本分析與冷門知識(shí)挖掘,對于專業(yè)一絲不茍,社交技能則接近負(fù)數(shù)。
和Kimi對話有時(shí)讓我想起《IT狂人》里,以“人機(jī)感”著稱的Moss,當(dāng)你讓他幫你修電腦,他給你長篇大論地介紹電腦的各種軟硬件系統(tǒng)的運(yùn)作方式。
我時(shí)常讓Kimi幫我查找數(shù)據(jù)來源及其鏈接。
當(dāng)其他AI工具瀏覽幾十個(gè)網(wǎng)頁后,仍然羅列出幾篇二次引用的文章時(shí);Kimi已經(jīng)快準(zhǔn)狠地給出原始來源的鏈接,輸出的只有短短一句話。
而當(dāng)GPT4.5、Grok-3爭相給自己貼上高情商、幽默感的標(biāo)簽時(shí),Kimi仍然拒絕擬人。模仿人類的情感流露對Kimi來說似乎是累贅。
就連Kimi的推理模型“長思考”(k1.5),其推理過程也更加忠于用戶輸入的字面意思,而不像DeepSeek那樣喜歡猜測用戶的言下之意、無中生有。
使用攻略:
1、硬核內(nèi)容的學(xué)術(shù)外掛:創(chuàng)作研究型內(nèi)容時(shí),利用Kimi處理長文本的能力,輔助查找、閱讀文獻(xiàn)。
2、適用于需要嚴(yán)謹(jǐn)、高安全性回答的專業(yè)領(lǐng)域。
06 寫在最后
沒有哪個(gè)硅基生物是完美的,正如沒有完美的人類。人類之所以有“人格”,就是因?yàn)樗麄兊娜毕莺烷W光點(diǎn)一樣多。正是這種微妙的平衡,才讓人性顯得可愛。而特長各異、缺陷各異的AI們,也開始顯現(xiàn)出它們的可愛之處。
與其造一個(gè)完美AI,不如用N個(gè)不同性格的AI,來滿足、激發(fā)、映照人類自己的N種需求和欲望。它們不光是替我做事,更讓我看到人類優(yōu)秀品質(zhì)的最大公約數(shù)——比如溫柔、幽默、敏銳、嚴(yán)謹(jǐn)。
隨著大模型軍備競賽即將陷入算力內(nèi)卷,未來的競爭點(diǎn)之一可能就在于——用戶更愿意喜歡什么樣的“AI性格”。我們也期待看到更豐富多樣的“AI性格”。
轉(zhuǎn)載請?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無評(píng)論哦,快來評(píng)論一下吧!
全部評(píng)論(0條)