777精品出轨人妻国产,熟女av人妻一区二区三四区,国产精品无码中文在线av,美脚パンスト女教师在线观看

“攜程問道”問不明白道

原創 收藏 評論
舉報 2024-10-11




作者 | Tniniuo

編輯 | 藍蘭


想靠AI旅游的朋友,終究還是沒有在攜程上問明白道。



我有個犟種朋友,喜歡各類科技花活,每次網上有新東西他都要試試。這個十一他要嘗試的是靠旅游行業垂直大模型——攜程問道,實現AI旅游。



我告訴他,AI旅游這事現在不靠譜。



整個大模型行業目前公認的事實是,AI大模型在發散性的內容上可能會超出預期,但在實際規劃和落地的任務上,基本只能處于copilot的角色,人力還是主導。問吃喝、本地游玩、出規劃,還不如大眾點評、小紅書高效。



甚至不如問我。



因為用戶在所謂的靠AI旅游這件事上,需要的是一個AI Agent(AI智能體/助理/助手)。而AI Agent要求的是精確性,但目前AI大模型的發散性大于精確性,因此AI旅游在當下還是一個悖論。



比如說想在上海玩,AI會搜索歷史數據和信息,告訴你外灘、石庫門、武康路、東方明珠、豫園、淮海路你都值得逛逛。但如果需要一個符合自己喜好的專屬行程,AI提供不了。你只能在AI提供的信息資料里做二次的人工篩選。



如果你想玩的更local一點,比如想找一家有品位的精釀吧,演繹水平高的劇本殺店,小姐姐多套路少的夜店,AI更推薦不出來。也就是說,攜程問道目前成不了AI Agent。



但顯然,我的犟種朋友不想聽我嗶嗶賴賴。



于是我們直接進入測試,讓攜程問道出一個10月2號—10月6號在上海的行程規劃。結果攜程問道只幫我們把行程規劃到了10月4號,10月5號和10月6號的行程它讓我們自己發揮。嗯......我上一個00后實習生,是領導家親戚,也差不多是這個味兒。





我們又問了下武康路到底有點什么獨特魅力,究竟能玩點啥?得出的結論是Citywalk。然后我們告訴攜程問道,如果不想在上海Citywalk,是否有更好的行程推薦。




結果攜程問道把之前推給我們的行程又重復了一遍。



好吧,黔驢技窮。



最后我們告訴攜程問道,想住在中山公園附近,讓他推薦幾家酒店。可能由于沒有精確的告訴它是上海中山公園,所以攜程問道給我推薦了天南地北,各個地方中山公園附近的酒店。這就很迷,咱們和攜程問道聊了半天,不一直都在聊上海旅游的事么?這點前后文語義的識別也這么困難么?



大模型行業里有個詞叫“AI幻覺”,即人工智能系統(自然語言處理模型)生成的內容與真實數據不符,或偏離用戶指令的現象。



說白了就是,用戶問前門樓子,AI答胯骨軸子。



短短三四個問題,我們看到攜程問道一直沉浸在AI幻覺中,離需要準確性的AI Agent還有不少距離。誠然,造成AI幻覺的的原因有很多,從數據質量差到算法缺陷,再到缺乏接地和過度擬合,都會導致AI幻覺。



然而,所有這些原因的核心是:AI 模型的輸出取決于它們的輸入,或它們為處理所述輸入而設計的方式。歸根結底,AI 模型無法自我推理、研究或事實核查。因此,需要準確性的AI Agent,在當下還無法完美實現。



理想狀態下的AI Agent是,大多數時候你只需給它一個最終你想要達成的目標,它能直接交付結果,過程你啥都不用管。



康奈爾大學、華盛頓大學和滑鐵盧大學以及非營利研究機構AI2的研究人員,最近進行了一項研究,測試了GPT-4o、Meta的Llama370B、Mistral的Mixtral 8x22B、Cohere的Command R+,以及調用API的模型,比如Perplexity的Sonar Large(基于Llama)、Google的Gemini 1.5 Pro和 Anthropic的Claude 3 Opus等多個開源模型,



實驗證明,各家模型產生的AI幻覺半斤八兩。在答案來源不是維基百科的情況下,每個模型的平均回答事實性都較低。當然,從另一個維度看,沒有AI幻覺,大模型就沒有發展可言。



但在目前這種AI幻覺泛濫的環境下,用戶想要一個規劃行程的Agent,或是某個行業的最新資訊和報告,幻覺就是致命缺陷。很明顯在這種情況下,以AI Agent為目標的AI旅游大模型,目前基本都是悖論。最多只是一個網絡素材整合工具。



這種窘態不止出現在攜程問道身上。字節的豆包、百度的文心一言等等,在AI旅游的表現上都挺一般。尤其是在理解復雜用戶需求和提供精準個性化服務方面。要么行程過于空洞,不知無謂。要么AI幻覺爆發,自己加戲太多,甚至一些AI模型連門票價格都會報錯。





目前行業的共識是,基于大模型的發散性產生的AI幻覺是沒法解決的,所以必須要通過恰當的微調形成行業專用的深模型。但當下,即使在ChatGpt的GPTs應用或是字節的Coze平臺,也很少有真正可用的,更好解決問題的Agent。



如果AI Agent無法基于用戶目標形成個性化推薦,AI旅游大模型又當如何?攜程問道目前在這上面抖了一個小聰明,即提供了一個涵蓋酒店、景點、餐飲及夜生活等多維度的“攜程口碑榜”,供用戶出游參考。



也就是攜程集團聯合創始人梁建章所謂的:利用攜程自己長年積累的數據和榜單,為用戶做推薦。直白點說就是,這些東西攜程的用戶玩了都說好,相信你也會覺得好。至于個性化,暫且不聊。


比如,我們問“上海最好的酒店是哪家?”



攜程問道基于“上海豪華酒店榜”得出結論,前灘香格里拉大酒店是上海最好的酒店。




略讓人驚訝,因為這酒店我住過。不差,只不過馬桶有點智能了,智能到半夜會自己工作。很卷,但瑕不掩瑜。可要說在一眾奢華酒店云集的上海,前灘香格里拉是TOP1,這個確實有點出乎意料。



于是我讓他問問這個“上海豪華酒店榜”是什么機構評定的,基于什么標準評定的?結果得出了一個比較好笑的結論。




實際上這個“上海豪華酒店榜”,就是攜程自己推出的“攜程口碑榜”其中一部分,會根據口碑、銷量等幾個維度來篩選,還有一些下榜規則。不過攜程點評現在避免不了人工干預成分在,且目前來看,下榜規則執行的也并不嚴格。




比如9月份剛被曝出來“1天2次6700元”事件的長春高新益田福朋喜來登,目前仍在“長春豪華酒店榜”名列第14,并沒有下榜。



實際上在整個AI服務流程中,攜程并沒有體現出來其所謂的,“通用AI大模型所沒有的旅游產品資源庫優勢”。這份“攜程口碑榜”也從一開始就彌漫著一股濃郁的商業氣息,看不出與大眾點評必吃榜、必玩榜有什么明顯的產品差異。



換句話說,即便今天沒有AI大模型,也不影響攜程推出一份“攜程口碑榜”。兩者之間沒有任何因果關系,以及強關聯性。



事實上,對于AI旅游大模型來說,真的可用的Agent一定不是簡單模塊組合可實現的,如果有,也只是曇花一現。AI大模型催生了Prompt Engineer的工作角色,AI Agent理應催生Flow Engineer一類崗位,需要一批兼具產品和編程思維能力的角色。



但在攜程的公開招聘中,目前沒有看到明顯具有Flow Engineer性質的崗位。



而在所有可公開查詢到的信息中,攜程距離AI Agent最近的一次,則是今年二季度財報的時候,攜程集團聯合創始人、董事局主席梁建章,CEO孫潔、CFO王肖璠等公司高管,首次以AI Agent形象,在財報會議上與投資人交流。



但很明顯,此AI Agent并非AI大模型行業的AI Agent,說穿了不過是類似數字人的奇技淫巧。



圖片來源于攝圖網和網絡截圖


本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本內容為作者獨立觀點,不代表數英立場。
本文禁止轉載,侵權必究。
本文系數英原創,未經允許不得轉載。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 邵东县| 芦溪县| 本溪市| 泰和县| 茌平县| 新丰县| 常州市| 大同市| 潮安县| 江油市| 杭锦后旗| 安溪县| 库车县| 镇坪县| 吉首市| 临澧县| 永安市| 德阳市| 拜泉县| 治多县| 油尖旺区| 九江市| 黄浦区| 筠连县| 冀州市| 腾冲县| 彭阳县| 新丰县| 阜康市| 左权县| 木兰县| 嘉禾县| 许昌市| 莱西市| 临颍县| 郸城县| 宁南县| 原平市| 台山市| 拉萨市| 康马县|