atypica.AI:用「語言模型」為「主觀世界」建模
人們不是在處理概率,而是在處理故事。
—— 丹尼爾·卡尼曼
People don't choose between things, they choose between descriptions of things.
—— Daniel Kahneman
商業研究是一門理解人類決策的學問。人并不只是根據純粹理性做決策,而是受到敘事、情感和認知偏見的影響。所以,理解影響決策的機制是商業研究的核心。我們開發了一個商業研究智能體「atypica.AI」:
通過構建「用戶智能體」來「模擬」消費者的個性和認知;
通過「專家智能體」與「用戶智能體」的「訪談」來分析消費者的行為和決策,并產生報告。
如果,「物理」為「客觀世界」建模;
那么,「語言模型」則有機會為「主觀世界」建模。
atypica.AI能夠捕捉數據分析無法處理的人類決策機制,為個人和商業決策問題提供深度洞察。
體驗地址:https://atypica.ai/
使用 atypica.AI
登陸atypica.AI,你只需要提出一個具體商業研究問題,atypica.AI會通過10-20分鐘的「長推理」給出一份詳盡的調研報告。
在這10-20分鐘的長推理中,atypica.AI會自動做如下的工作:
1. <atypica.AI>追問你1-5個問題,把研究問題弄清楚;
2. <atypica.AI>設計一系列工作任務;
3. <atypica.AI>按照工作任務瀏覽社交媒體(現在僅瀏覽小紅書,未來會有更豐富來源);
4. <atypica.AI>按照瀏覽結果建立多種「用戶智能體」;
5. <atypica.AI>采訪這些「用戶智能體」,如沒有得到答案,會繼續建立「智能體」;
6. <atypica.AI>總結采訪結果;
7. <atypica.AI>生成指定視覺風格報告;
「Nerd Stats」會記錄工作過程中耗費多少時間、步驟、有多少個智能體角色、耗費多少token等,這也是一種智能體的「工作證明」(Proof of Work)。
注:atypica.AI的nerd stats
atypica.AI的使用場景
測試 / Testing:快速、低成本測試取消費者的反饋
<羅技鼠標>在<小紅書>上選題,哪個會更受歡迎?
a.【輕薄如羽,性能如虎】羅技MX Keys迷你版陪我高效辦公的日常
b. 從按鍵到芯片:揭秘羅技鍵盤的靜音科技是如何實現的
c. 一鍵多設備切換:我用羅技FLOW技術讓工作效率翻倍的小技巧
d. 30天續航不是夢:羅技鍵盤背后的節能技術大揭秘
e. 人體工學設計背后的故事:羅技ERGO K860如何拯救我的腕隧道綜合癥
洞察 / Insight:獲取開放性的消費者需求
I am the General Manager of LV (Louis Vuitton) Shanghai. What feedback do customers have about the in-store experience at our Shanghai LV boutiques? What areas need improvement, and what aspects are working well that we should continue to enhance? Please give me a holistic report.
共創 / Co-create:與消費者共同創造新的商業想法
和一線城市的年輕父母,一起共創Mars的<脆香米>的新產品想法?
規劃 / Planning:按照市場需求進行商業規劃
INAH 銀那無醇葡萄飲市場營銷策劃書
歡迎體驗atypica.AI
atypica.AI還沒有設計好如何商業化,先發布一個「體驗版」。
用戶可以免費進行3個研究,之后每個請我們一杯咖啡如何 ???
atypica.AI「深入研究」和「企業版」功能
針對產生的研究結果可以繼續下鉆、追問,觸發「深度研究」功能,該功能將在「atypica.AI企業版」上線。這一功能使用戶能夠將初步分析作為起點,而非終點,從而開啟更加深入的探索旅程。當研究人員發現初步結果中的關鍵洞察時,可以通過特定提示或命令激活深度研究模式,系統將自動展開多層次分析。
「atypica企業版」部分規劃能力如下,感興趣請在頭像下面點擊「了解企業版」留資。
調用工具能力
多模態內容分析、洞察(文字、圖、視頻、富文本等)
更強的報告推理能力
針對報告內容進行深度下鉆研究
定制化報告結構設計
調用數據能力
接入企業私有數據(通過DAM)
接入抖音
接入互聯網
接入海外社媒平臺(Ins、FB、TT等)
權限安全管理
團隊協作功能(分享、協作)
數據安全功能(指定可見、有效期)
atypica.AI也可以用在個人場景
雖然atypica.AI是以商業研究分析的智能體,但是也可以進行一些個人決策研究,下面????是我們的小伙伴千奇百怪的問題:
開放問題:
為生日晚餐選合適的中餐餐館?
選擇問題:
便攜式顯示器該怎么選?
規劃問題:
游泳特長生,該怎么規劃去美國或英國讀高中?
atypica.AI的局限性
輸入問題的質量:輸入問題的準確度,很大程度上決定了報告的質量;
模型精確度局限:斯坦福的研究中表明這種方法可以80%準確模擬消費者的復雜決策過程,對高度情感化或情境依賴的決策預測有局限,對新興小眾消費群體的模擬不夠準確(合成橙汁還是和天然橙汁不一樣);
數據整合復雜性:數據質量和結構差異大,整合難度高,數據干凈度問題可能導致模型扭曲;這種方法更善于模擬用戶的正向和負向反饋,但是不擅長模擬用戶的偏見和局限。
創新性預測困難:難以預測真正突破性的創新反應。
atypica.AI的緣起
多智能體:
2023年,斯坦福小鎮的論文(《Generative Agents: Interactive Simulacra of Human Behavior》)讓我們第一次見識了多智能體互動的概念,但是這篇文章并沒有真正的展示智能體是如何進行交互的;
注:斯坦福小鎮研究團隊《Generative Agents: Interactive Simulacra of Human Behavior》
語言模型為主觀世界建模:
2024年11月,斯坦福小鎮研究團隊發表了題為《Generative Agent Simulations of 1,000 People》的開創性論文,該研究成功模擬了1000個隨機美國人的行為模式。研究人員通過AI對真實人類進行深入采訪,構建了能夠準確反映個體行為和決策模式的智能體。令人矚目的是,這些智能體與真人的行為一致性高達85%以上,展現出前所未有的模擬精度。
這項研究揭示了智能體模擬真實人類行為和進行有效訪談的巨大潛力。我們可以用一個比喻來理解其創新之處:傳統研究用戶(如同研究橙汁)的方法是分析其組成元素(標簽),但即使掌握了全部標簽,也難以完整重構用戶的復雜性。而這種新方法則相當于將橙汁提煉為精華粉末,再通過語言模型作為"水"將其重新沖調成橙汁。
雖然這種「合成橙汁」并非完全天然,但它盡量模擬了真實橙汁的口感、色彩和營養特性。這種方法突破了傳統用戶畫像中簡化、標簽化的局限,轉而采用更為豐富、語境化的方式來建模人類的主觀世界,為我們理解和預測人類行為提供了嶄新視角。
注:斯坦福小鎮研究團隊《Generative Agent Simulations of 1,000 People》
讓模型調用工具:
2023年12月,OpenAI發布了GPT-4的Function Calling功能,讓模型能夠調用外部工具;2024年11月,Claude的MCP協議,讓我們看到了模型操作工具(比如我們做的內容管理工具)的可能性。這種技術進步開創了全新的應用場景,使模型不再局限于對話框內的交互,而是能夠主動與外部世界建立連接。例如,模型現在可以瀏覽小紅書,自主發掘有趣的內容,篩選潛在的熱點話題,甚至能夠分析內容表現和用戶反饋。
發散優先的長推理模型:
2025年2月,Deepseek R1讓我們看到透明的推理過程,因此知道了怎么來設計在基座模型基礎上的推理架構。與針對客觀世界 / 科學問題的推理方法強調“收斂”不同,主觀世界 / 商業問題的推理需要強調“發散”。我們定義為四個維度:
1)學習過去的案例
2)靈光乍現
3)反饋的質量
4)迭代的數量
因此我們基于這四個維度,開始進行多步驟、長發散的推理模型架構“Creative Reasoning”的開發,從而形成對通用商業問題思考、分析、研究的調優;
多智能體的產品形態:
2025年3月,Manus、Claude的Artefacts、Devin的發布,讓我們看到了多智能體產品設計的可能性。尤其是Manus在如何把智能體工作過程表達出來,并可以進行回放上的產品創新??吹街悄荏w如何工作,確實可以讓人對其產生的結果更有同理心。
注:Claude的Artefacts
注:Manus
atypica.AI的皮膚:
來自于代表極客精神的快樂嬉皮鬼社區HippyGhosts.io,每一個「智能體」的物理化身都是一枚「hippy ghost」。
立即體驗:https://atypica.ai/
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)