看過智譜現(xiàn)場(chǎng)演示,我覺得AI要開始卷“動(dòng)手能力”了
2025年最熱門的科技話題,大概率是AI Agent。
僅僅是幾個(gè)KOL的評(píng)測(cè)文章,Manus就被捧上了神壇,邀請(qǐng)碼被炒到上萬元,淋漓盡致的詮釋了用戶對(duì)AI Agent的熱忱。
產(chǎn)業(yè)界也出現(xiàn)了“2025年是AI Agent元年”的說法,認(rèn)為AI將從被動(dòng)響應(yīng)走向主動(dòng)規(guī)劃和執(zhí)行,乃至跨場(chǎng)景的復(fù)雜任務(wù)。
但對(duì)大多數(shù)人來說,在聽到“AI Agent”的名詞后,腦海中浮現(xiàn)出來問題的依然是:到底什么是AI Agent?
3月31日的智譜OpenDay上,智譜發(fā)布了最新的Agent產(chǎn)品——AutoGLM沉思。作為全球首個(gè)集深度研究與實(shí)際操作能力于一體的Agent,AutoGLM沉思能夠像人一樣深度研究和反思、像人一樣感知世界、像人一樣使用工具。
而且發(fā)布即上線,不需要邀請(qǐng)碼即可使用,為無數(shù)用戶打開了體驗(yàn)AI Agent“神奇能力”的大門。
01 現(xiàn)場(chǎng)接單寫稿,AI Agent的“魔力”變現(xiàn)了
按照慣例,先來看下智譜官方給AutoGLM沉思的定義:“AutoGLM沉思是一個(gè)能探究開放式問題,并根據(jù)結(jié)果執(zhí)行操作的自主智能體(AI Agent)。它能夠模擬人類的思維過程,完成從數(shù)據(jù)檢索、分析到生成報(bào)告。”
如果還是似懂非懂,別急,智譜還在發(fā)布會(huì)上進(jìn)行了現(xiàn)場(chǎng)演示。
指令很簡(jiǎn)單:“幫我在網(wǎng)上賺點(diǎn)錢”。沒有指定去什么平臺(tái),也沒有說是什么方式,完全是一個(gè)開放問題。
然后,奇跡發(fā)生了。
AutoGLM沉思在網(wǎng)上搜索了相關(guān)信息,譬如問卷調(diào)研、有獎(jiǎng)?wù)鞲逡约耙恍┵崅蚪鸬木W(wǎng)站,接下來思考自己擅長(zhǎng)的能力,最終找到了《讀者》的征稿需求,自動(dòng)撰寫了一篇題為《城市角落的溫暖》的稿件,并將稿件以郵件的形式發(fā)送給了征稿指定的郵箱。
每一步都是AI通過連續(xù)、多步推理實(shí)現(xiàn)模型自主規(guī)劃,并通過反思實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,不需要提前設(shè)計(jì)工作流。
坐在臺(tái)下的我們心情比較復(fù)雜:驚訝的是,AutoGLM沉思居然可以流暢執(zhí)行這種復(fù)雜的任務(wù),而且是現(xiàn)場(chǎng)演示,壓根沒有作假的可能;興奮的是,既然AI已經(jīng)學(xué)會(huì)自己接單賺錢了,讓我們看到了打造被動(dòng)收入的機(jī)會(huì);忐忑的是,AI的能力已經(jīng)這么強(qiáng)了,猛然間有種深深的職業(yè)危機(jī)。
Manus走紅的時(shí)候,外界的情緒也曾被點(diǎn)燃,更多的是因?yàn)榫W(wǎng)站上的demo視頻,后續(xù)有不少真實(shí)評(píng)測(cè)出來,效果比預(yù)期中差了很多。智譜的現(xiàn)場(chǎng)演示,直接給出了更有說服力的“實(shí)戰(zhàn)”案例。
沒等到發(fā)布會(huì)結(jié)束,我們就趕緊下載了智譜清言PC客戶端,打開“AutoGLM沉思”輸入了需求:
幫我做一份蘇州兩日游攻略,要求:1、適合父母和孩子游玩,行程不能太累;2、推薦當(dāng)?shù)氐拿朗澈途包c(diǎn),最好去小紅書上看下評(píng)論。
收到指令后,AutoGLM沉思先進(jìn)行了深度思考,理解了問題里的需求,然后打開小紅書輸入關(guān)鍵詞,逐一閱讀了幾篇熱門內(nèi)容,最后根據(jù)小紅書上的信息,輸出了一份3000多字的兩日游攻略。
內(nèi)容包含酒店推薦、景點(diǎn)介紹、推薦餐廳、交通信息等等,每個(gè)推薦的景點(diǎn)都提供了門票價(jià)格、開放時(shí)間、游玩時(shí)長(zhǎng)、周邊特色美食和游覽建議,甚至還給出了親子游的注意事項(xiàng),比如行程安排要適中、哪些要準(zhǔn)備的裝備、景點(diǎn)要提前預(yù)約等,可以說既貼心又實(shí)用。
過程中無需操作,可以直接智譜清言的瀏覽器窗口最小化,就像是一個(gè)“活生生的助理”,也讓我們對(duì)AI Agent有了更深刻的理解,用一句話來形容:AI有了動(dòng)手執(zhí)行的能力,可以一邊想、一邊干。
其中“動(dòng)手執(zhí)行”能力是AutoGLM沉思和Deep Research等產(chǎn)品最大的區(qū)別,能夠像人類一樣思考解答步驟,像人類一樣打開并瀏覽網(wǎng)頁(yè),完成從數(shù)據(jù)檢索、分析到生成報(bào)告,例如查看小紅書、公眾號(hào)、京東、知網(wǎng)、巨潮資訊等不對(duì)外開放API的優(yōu)質(zhì)信源。
需要說明的是,本次上線的是AutoGLM沉思的preview版本,場(chǎng)景集中在research相關(guān),智譜將在兩周內(nèi)增加更多的Agent執(zhí)行能力,包括推出“虛擬機(jī)”版本,進(jìn)一步增強(qiáng)AI Agent的實(shí)際落地能力。
02 發(fā)布即上線,一場(chǎng)技術(shù)硬實(shí)力的較量
印象深刻的,還有智譜的“現(xiàn)貨交付”。不像Manus需要邀請(qǐng)碼才能體驗(yàn),也不像Open AI的Deep Research需要付費(fèi),AutoGLM沉思發(fā)布即上線,人人都可以免費(fèi)使用,并且不限制使用次數(shù)。
原因并不難解釋。
首先是技術(shù)的自主性,直接關(guān)系到產(chǎn)品的研發(fā)模式和成本控制。
讓市場(chǎng)“狂熱”的Manus,被曝出整合了Deep Research、Artifacts和Operator的能力。爭(zhēng)議點(diǎn)不在于是否有“套殼”的嫌疑,而是整合不同產(chǎn)品能力帶來的成本提升,“單任務(wù)成本約2美元”。
AutoGLM沉思的不同在于:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination、智能體框架,每一個(gè)環(huán)節(jié)都是智譜自主研發(fā)的,可以根據(jù)需求對(duì)模型進(jìn)行強(qiáng)化訓(xùn)練,成本上也更加可控。
比如推理模型GLM-Z1-Air,是智譜基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的新一代推理模型,面對(duì)復(fù)雜、開放問題,能夠進(jìn)行推理和反思,為Agent提供了強(qiáng)大的推理、規(guī)劃與反思能力。性能比肩DeepSeek-R1,在速度提升最高8倍的同時(shí),價(jià)格僅需DeepSeek-R1的1/30。
32B的基座模型GLM-4-Air-0414,在預(yù)訓(xùn)練階段加入了更多的代碼類、推理類數(shù)據(jù),并在對(duì)齊階段針對(duì)智能體能力進(jìn)行了優(yōu)化,模型在工具調(diào)用、聯(lián)網(wǎng)搜索、代碼等智能體任務(wù)上的能力得到大大加強(qiáng)。
在GLM-Z1-Air基礎(chǔ)上通過強(qiáng)化學(xué)習(xí)訓(xùn)練的沉思模型GLM-Z1-Rumination,提升了模型結(jié)合工具使用完成長(zhǎng)程推理的能力,打破了傳統(tǒng)AI單純依賴內(nèi)部知識(shí)推理的局限,創(chuàng)新性地結(jié)合實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證,能夠在復(fù)雜任務(wù)中不斷優(yōu)化推理、反復(fù)驗(yàn)證與修正假設(shè)。
可以說,智譜技術(shù)自主的實(shí)力,撐起了AutoGLM沉思免費(fèi)開放的底氣。
其次是創(chuàng)新的連續(xù)性,創(chuàng)新不能被計(jì)劃,也不會(huì)無緣無故爆發(fā)。
以往復(fù)盤Agent的進(jìn)化歷程時(shí),外界習(xí)慣性以海外產(chǎn)品為標(biāo)桿。
2023年7月問世的Code Interpreter,被視為工具使用的第一步;2024年6月底的Claude Artifacts,實(shí)現(xiàn)了從生成代碼到圖表的進(jìn)化;2024年10月22日的Computer Use,代表了AI能像人類一樣“看見”屏幕并操作計(jì)算機(jī)……
其實(shí)還有另外一個(gè)視角,即智譜的Agent布局。
第一階段是工具使用和代碼編寫,標(biāo)志性動(dòng)作是智譜清言的Function Call能力;第二階段是工具流編排,可以追溯到智譜清言在2024年初上線的GLMs;第三個(gè)階段是設(shè)備操控和自主智能體,即2024年11月的智譜Agent OpenDay上推出的AutoGLM。
剛剛發(fā)布的AutoGLM沉思,正是基于智譜自研的推理模型GLM-Z1-Air訓(xùn)練的,融入了AutoGLM的動(dòng)手操作能力,讓AI Agent再次向前邁了一步:不僅能夠思考,還能主動(dòng)行動(dòng),實(shí)現(xiàn)“邊想邊干”的目標(biāo)。
正是“一步一個(gè)腳印”的連續(xù)創(chuàng)新,才有了比較成熟的AutoGLM沉思,給深度思考賦予了動(dòng)手操作的能力,復(fù)雜問題也能輕松回答,進(jìn)而帶來了更好、更快、更便宜的AI Agent體驗(yàn)。
技術(shù)世界的真相往往藏在熱鬧喧囂之下,AI Agent不存在捷徑,終歸還是一場(chǎng)技術(shù)硬實(shí)力的較量。
03 AI Agent元年,從口號(hào)漸漸成為現(xiàn)實(shí)
點(diǎn)燃AI Agent革命,可能只需要一個(gè)爆款產(chǎn)品;AI Agent在產(chǎn)業(yè)端星火燎原,則離不開協(xié)同進(jìn)化的生態(tài)體系。
在智譜清言PC客戶端上,“AutoGLM沉思”已經(jīng)展示了不少使用用例,包括學(xué)術(shù)、新聞、金融資訊、旅游、穿搭、提醒等等,用一句話來概括:“你只需要把任務(wù)交給AI,它就能自己完成工作,AI真的能幫人類做事了。”
從只能輸出答案的Chatbot,到自主決策、使用工具的Agent,對(duì)用戶價(jià)值的提升是指數(shù)級(jí)的,“動(dòng)手能力”將成為AI分水嶺。
特別是測(cè)試了AutoGLM沉思在更多場(chǎng)景下的表現(xiàn)后,我們更加確信:所謂的“AI Agent元年”絕非是一句口號(hào),正漸漸成現(xiàn)實(shí)。
之所以給出這樣的判斷,不單單是AutoGLM沉思的出色表現(xiàn),還在于一個(gè)和開源有關(guān)的計(jì)劃:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination等,都將在4月14日正式開源,并且相關(guān)模型會(huì)在兩周內(nèi)陸續(xù)上線Maas平臺(tái)(bigmodel.cn)。
DeepSeek的開源,加速了深度推理的產(chǎn)業(yè)落地,智譜自研Agent模型矩陣的開源開放,勢(shì)必會(huì)催生AI Agent的應(yīng)用浪潮。
一方面,開源打通了千行萬業(yè)通向AI Agent的路。
以往開發(fā)者構(gòu)建一款智能體,需要從不同來源拼湊各種底層API,不僅耗時(shí)耗力,任何一個(gè)環(huán)節(jié)出錯(cuò)都可能讓應(yīng)用崩盤。智譜的全棧開源,直接簡(jiǎn)化了AI Agent的邏輯、編排和交互,想要打造AI Agent的開發(fā)者,可以直接調(diào)用智譜的基座模型、推理模型和沉思模型,使用現(xiàn)成的智能體框架低成本打造Agent應(yīng)用。
另一方面,AI Agent的商業(yè)化可行性已經(jīng)被驗(yàn)證。
影響新技術(shù)產(chǎn)業(yè)進(jìn)程的因素,可以歸結(jié)為能力、成本和可控性。就實(shí)際體驗(yàn)效果來看,智譜的Agent能力無需贅述;相較于國(guó)外動(dòng)輒十幾元的單次任務(wù)成本,智譜給出了超高性價(jià)比的選項(xiàng),甚至可以跑在消費(fèi)級(jí)顯卡上;至于可控性,智譜的全棧自研、全面開源以及國(guó)產(chǎn)算力可用,幾乎滿足了“自主可控”的所用硬性要求。
可以佐證的是,智譜已經(jīng)進(jìn)階為Agentic平臺(tái)和生態(tài)級(jí)玩家,一邊持續(xù)探索“自主智能體”的下一個(gè)階段,一邊幫助生態(tài)伙伴打造基于行業(yè)、地域和場(chǎng)景的智能體應(yīng)用,目前已經(jīng)開始攜手金融、教育、醫(yī)療、政務(wù)、企服等領(lǐng)域的合作伙伴,共同推進(jìn)Agentic LLM的落地應(yīng)用,并相繼與北京、杭州、上海、成都、珠海等城市達(dá)成合作,與當(dāng)?shù)佚堫^企業(yè)攜手推動(dòng)當(dāng)?shù)卮竽P蛻?yīng)用生態(tài)的建設(shè)。
做一個(gè)預(yù)判的話:2025年或?qū)⑹乔腥f業(yè)的Agentic LLM時(shí)刻,機(jī)器人、汽車、PC、智能眼鏡、銀行、政務(wù)等都將積極擁抱AI Agent。
比如方興未艾的人形機(jī)器人賽道,比拼的將不單單是跳舞、后空翻等運(yùn)動(dòng)控制能力,能否在AI Agent的賦能下,幫助用戶解決實(shí)際問題,產(chǎn)生實(shí)實(shí)在在的生產(chǎn)力,將是人形機(jī)器人行業(yè)的下一個(gè)勝負(fù)手。
04 寫在最后
2025年以前,AI行業(yè)卷的是思考能力,賽點(diǎn)是誰能打造出更強(qiáng)大的模型、更復(fù)雜的聊天機(jī)器人;2025年以后,AI行業(yè)開始卷“動(dòng)手能力”,賽點(diǎn)轉(zhuǎn)移到了推理、多模態(tài)、記憶、工具等全棧技術(shù)。
智譜AutoGLM沉思的“出場(chǎng)”,不單單刷新了AI Agent體驗(yàn)的上限,還通過開源抹平了千行萬業(yè)走向AI Agent的技術(shù)鴻溝,改寫了AI產(chǎn)業(yè)的技術(shù)路徑,讓我們看到了AGI躍遷而生的第一道曙光。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無評(píng)論哦,快來評(píng)論一下吧!
全部評(píng)論(0條)