看過智譜現場演示，我覺得AI要開始卷“動手能力”了

原創贊收藏評論

舉報 2025-03-31

掃描,分享朋友圈

2025年最熱門的科技話題，大概率是AI Agent。

僅僅是幾個KOL的評測文章，Manus就被捧上了神壇，邀請碼被炒到上萬元，淋漓盡致的詮釋了用戶對AI Agent的熱忱。

產業界也出現了“2025年是AI Agent元年”的說法，認為AI將從被動響應走向主動規劃和執行，乃至跨場景的復雜任務。

但對大多數人來說，在聽到“AI Agent”的名詞后，腦海中浮現出來問題的依然是：到底什么是AI Agent？

3月31日的智譜OpenDay上，智譜發布了最新的Agent產品——AutoGLM沉思。作為全球首個集深度研究與實際操作能力于一體的Agent，AutoGLM沉思能夠像人一樣深度研究和反思、像人一樣感知世界、像人一樣使用工具。

而且發布即上線，不需要邀請碼即可使用，為無數用戶打開了體驗AI Agent“神奇能力”的大門。

01 現場接單寫稿，AI Agent的“魔力”變現了

按照慣例，先來看下智譜官方給AutoGLM沉思的定義：“AutoGLM沉思是一個能探究開放式問題，并根據結果執行操作的自主智能體（AI Agent）。它能夠模擬人類的思維過程，完成從數據檢索、分析到生成報告。”

如果還是似懂非懂，別急，智譜還在發布會上進行了現場演示。

指令很簡單：“幫我在網上賺點錢”。沒有指定去什么平臺，也沒有說是什么方式，完全是一個開放問題。

然后，奇跡發生了。

AutoGLM沉思在網上搜索了相關信息，譬如問卷調研、有獎征稿以及一些賺傭金的網站，接下來思考自己擅長的能力，最終找到了《讀者》的征稿需求，自動撰寫了一篇題為《城市角落的溫暖》的稿件，并將稿件以郵件的形式發送給了征稿指定的郵箱。

每一步都是AI通過連續、多步推理實現模型自主規劃，并通過反思實現動態調整，不需要提前設計工作流。

坐在臺下的我們心情比較復雜：驚訝的是，AutoGLM沉思居然可以流暢執行這種復雜的任務，而且是現場演示，壓根沒有作假的可能；興奮的是，既然AI已經學會自己接單賺錢了，讓我們看到了打造被動收入的機會；忐忑的是，AI的能力已經這么強了，猛然間有種深深的職業危機。

Manus走紅的時候，外界的情緒也曾被點燃，更多的是因為網站上的demo視頻，后續有不少真實評測出來，效果比預期中差了很多。智譜的現場演示，直接給出了更有說服力的“實戰”案例。

沒等到發布會結束，我們就趕緊下載了智譜清言PC客戶端，打開“AutoGLM沉思”輸入了需求：

幫我做一份蘇州兩日游攻略，要求：1、適合父母和孩子游玩，行程不能太累；2、推薦當地的美食和景點，最好去小紅書上看下評論。

收到指令后，AutoGLM沉思先進行了深度思考，理解了問題里的需求，然后打開小紅書輸入關鍵詞，逐一閱讀了幾篇熱門內容，最后根據小紅書上的信息，輸出了一份3000多字的兩日游攻略。

內容包含酒店推薦、景點介紹、推薦餐廳、交通信息等等，每個推薦的景點都提供了門票價格、開放時間、游玩時長、周邊特色美食和游覽建議，甚至還給出了親子游的注意事項，比如行程安排要適中、哪些要準備的裝備、景點要提前預約等，可以說既貼心又實用。

過程中無需操作，可以直接智譜清言的瀏覽器窗口最小化，就像是一個“活生生的助理”，也讓我們對AI Agent有了更深刻的理解，用一句話來形容：AI有了動手執行的能力，可以一邊想、一邊干。

其中“動手執行”能力是AutoGLM沉思和Deep Research等產品最大的區別，能夠像人類一樣思考解答步驟，像人類一樣打開并瀏覽網頁，完成從數據檢索、分析到生成報告，例如查看小紅書、公眾號、京東、知網、巨潮資訊等不對外開放API的優質信源。

需要說明的是，本次上線的是AutoGLM沉思的preview版本，場景集中在research相關，智譜將在兩周內增加更多的Agent執行能力，包括推出“虛擬機”版本，進一步增強AI Agent的實際落地能力。

02 發布即上線，一場技術硬實力的較量

印象深刻的，還有智譜的“現貨交付”。不像Manus需要邀請碼才能體驗，也不像Open AI的Deep Research需要付費，AutoGLM沉思發布即上線，人人都可以免費使用，并且不限制使用次數。

原因并不難解釋。

首先是技術的自主性，直接關系到產品的研發模式和成本控制。

讓市場“狂熱”的Manus，被曝出整合了Deep Research、Artifacts和Operator的能力。爭議點不在于是否有“套殼”的嫌疑，而是整合不同產品能力帶來的成本提升，“單任務成本約2美元”。

AutoGLM沉思的不同在于：基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination、智能體框架，每一個環節都是智譜自主研發的，可以根據需求對模型進行強化訓練，成本上也更加可控。

比如推理模型GLM-Z1-Air，是智譜基于擴展強化學習技術訓練的新一代推理模型，面對復雜、開放問題，能夠進行推理和反思，為Agent提供了強大的推理、規劃與反思能力。性能比肩DeepSeek-R1，在速度提升最高8倍的同時，價格僅需DeepSeek-R1的1/30。

32B的基座模型GLM-4-Air-0414，在預訓練階段加入了更多的代碼類、推理類數據，并在對齊階段針對智能體能力進行了優化，模型在工具調用、聯網搜索、代碼等智能體任務上的能力得到大大加強。

在GLM-Z1-Air基礎上通過強化學習訓練的沉思模型GLM-Z1-Rumination，提升了模型結合工具使用完成長程推理的能力，打破了傳統AI單純依賴內部知識推理的局限，創新性地結合實時聯網搜索、動態工具調用、深度分析和自我驗證，能夠在復雜任務中不斷優化推理、反復驗證與修正假設。

可以說，智譜技術自主的實力，撐起了AutoGLM沉思免費開放的底氣。

其次是創新的連續性，創新不能被計劃，也不會無緣無故爆發。

以往復盤Agent的進化歷程時，外界習慣性以海外產品為標桿。

2023年7月問世的Code Interpreter，被視為工具使用的第一步；2024年6月底的Claude Artifacts，實現了從生成代碼到圖表的進化；2024年10月22日的Computer Use，代表了AI能像人類一樣“看見”屏幕并操作計算機……

其實還有另外一個視角，即智譜的Agent布局。

第一階段是工具使用和代碼編寫，標志性動作是智譜清言的Function Call能力；第二階段是工具流編排，可以追溯到智譜清言在2024年初上線的GLMs；第三個階段是設備操控和自主智能體，即2024年11月的智譜Agent OpenDay上推出的AutoGLM。

剛剛發布的AutoGLM沉思，正是基于智譜自研的推理模型GLM-Z1-Air訓練的，融入了AutoGLM的動手操作能力，讓AI Agent再次向前邁了一步：不僅能夠思考，還能主動行動，實現“邊想邊干”的目標。

正是“一步一個腳印”的連續創新，才有了比較成熟的AutoGLM沉思，給深度思考賦予了動手操作的能力，復雜問題也能輕松回答，進而帶來了更好、更快、更便宜的AI Agent體驗。

技術世界的真相往往藏在熱鬧喧囂之下，AI Agent不存在捷徑，終歸還是一場技術硬實力的較量。

03 AI Agent元年，從口號漸漸成為現實

點燃AI Agent革命，可能只需要一個爆款產品；AI Agent在產業端星火燎原，則離不開協同進化的生態體系。

在智譜清言PC客戶端上，“AutoGLM沉思”已經展示了不少使用用例，包括學術、新聞、金融資訊、旅游、穿搭、提醒等等，用一句話來概括：“你只需要把任務交給AI，它就能自己完成工作，AI真的能幫人類做事了。”

從只能輸出答案的Chatbot，到自主決策、使用工具的Agent，對用戶價值的提升是指數級的，“動手能力”將成為AI分水嶺。

特別是測試了AutoGLM沉思在更多場景下的表現后，我們更加確信：所謂的“AI Agent元年”絕非是一句口號，正漸漸成現實。

之所以給出這樣的判斷，不單單是AutoGLM沉思的出色表現，還在于一個和開源有關的計劃：基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination等，都將在4月14日正式開源，并且相關模型會在兩周內陸續上線Maas平臺（bigmodel.cn）。

DeepSeek的開源，加速了深度推理的產業落地，智譜自研Agent模型矩陣的開源開放，勢必會催生AI Agent的應用浪潮。

一方面，開源打通了千行萬業通向AI Agent的路。

以往開發者構建一款智能體，需要從不同來源拼湊各種底層API，不僅耗時耗力，任何一個環節出錯都可能讓應用崩盤。智譜的全棧開源，直接簡化了AI Agent的邏輯、編排和交互，想要打造AI Agent的開發者，可以直接調用智譜的基座模型、推理模型和沉思模型，使用現成的智能體框架低成本打造Agent應用。

另一方面，AI Agent的商業化可行性已經被驗證。

影響新技術產業進程的因素，可以歸結為能力、成本和可控性。就實際體驗效果來看，智譜的Agent能力無需贅述；相較于國外動輒十幾元的單次任務成本，智譜給出了超高性價比的選項，甚至可以跑在消費級顯卡上；至于可控性，智譜的全棧自研、全面開源以及國產算力可用，幾乎滿足了“自主可控”的所用硬性要求。

可以佐證的是，智譜已經進階為Agentic平臺和生態級玩家，一邊持續探索“自主智能體”的下一個階段，一邊幫助生態伙伴打造基于行業、地域和場景的智能體應用，目前已經開始攜手金融、教育、醫療、政務、企服等領域的合作伙伴，共同推進Agentic LLM的落地應用，并相繼與北京、杭州、上海、成都、珠海等城市達成合作，與當地龍頭企業攜手推動當地大模型應用生態的建設。

做一個預判的話：2025年或將是千行萬業的Agentic LLM時刻，機器人、汽車、PC、智能眼鏡、銀行、政務等都將積極擁抱AI Agent。

比如方興未艾的人形機器人賽道，比拼的將不單單是跳舞、后空翻等運動控制能力，能否在AI Agent的賦能下，幫助用戶解決實際問題，產生實實在在的生產力，將是人形機器人行業的下一個勝負手。

04 寫在最后

2025年以前，AI行業卷的是思考能力，賽點是誰能打造出更強大的模型、更復雜的聊天機器人；2025年以后，AI行業開始卷“動手能力”，賽點轉移到了推理、多模態、記憶、工具等全棧技術。

智譜AutoGLM沉思的“出場”，不單單刷新了AI Agent體驗的上限，還通過開源抹平了千行萬業走向AI Agent的技術鴻溝，改寫了AI產業的技術路徑，讓我們看到了AGI躍遷而生的第一道曙光。

本文系作者授權數英發表，內容為作者獨立觀點，不代表數英立場。
未經授權嚴禁轉載，授權事宜請聯系作者本人，侵權必究。