用行動(dòng)回應(yīng)“實(shí)體清單”,智譜發(fā)布了一系列新模型
1月15日晚間,美國商務(wù)部工業(yè)和安全局(BIS)修訂了《出口管制條例》(EAR),以安全為由在實(shí)體清單中分兩批增加了25個(gè)中國實(shí)體。
其中就包括智譜及其子公司,也是國內(nèi)首家被美國列入實(shí)體清單的大模型初創(chuàng)企業(yè)。
當(dāng)天晚上,智譜官方就作出了公開回應(yīng),除了強(qiáng)烈反對(duì)美國的惡意打壓,還特意寫了這樣一段話:鑒于智譜掌握全鏈路大模型核心技術(shù)的事實(shí),被列入實(shí)體清單不會(huì)對(duì)公司業(yè)務(wù)產(chǎn)生實(shí)質(zhì)影響。
到了1月16日下午,智譜正式做出行動(dòng):發(fā)布了全新的端到端模型GLM-Realtime;同步升級(jí)了GLM-4-Air和GLM-4V-Plus模型;特別設(shè)立 Flash 系列普惠模型,向全社會(huì)免費(fèi)開放。
前腳剛被美國”制裁“,后腳就上新模型,頗為幾分”掀桌子硬剛“的味道。
而坊間也一直流傳著這樣一種說法——被美國列入“實(shí)體清單”,相當(dāng)于是對(duì)一家企業(yè)硬實(shí)力的認(rèn)證。
正式被美國“蓋章認(rèn)證”的智譜,這次給出了哪些黑科技?對(duì)中國AI產(chǎn)業(yè)的自主自強(qiáng)又有哪些啟示?
讓我們一一揭曉。
1、會(huì)唱歌、低延遲、可以Function Call的GLM-Realtime
四個(gè)多月前,智譜清言APP上線了“視頻通話”功能,成為首個(gè)可以通過文本、音頻、圖像和視頻來進(jìn)行多模態(tài)互動(dòng)和實(shí)時(shí)推理的AI助手,讓很多人養(yǎng)成了和“小智”打視頻電話的習(xí)慣。
基于對(duì)多模態(tài)模型的理解與研發(fā)積累,智譜發(fā)布了全新的端到端模型GLM-Realtime,能力再次進(jìn)階。(感興趣的小伙伴,可以觀看智譜官網(wǎng)的視頻演示,詳細(xì)了解GLM-Realtime的“神奇能力”。)
視頻理解與語音交互:支持長達(dá)2分鐘的內(nèi)容記憶能力,能夠?qū)崟r(shí)處理視頻和語音輸入。
清唱功能:創(chuàng)新性地實(shí)現(xiàn)了清唱功能,首次讓大模型具備在對(duì)話中的歌唱能力,進(jìn)一步增強(qiáng)了交互的趣味性和實(shí)用性。
Function Call 功能:支持調(diào)用外部知識(shí)和工具,擴(kuò)展了模型在商業(yè)場景中的應(yīng)用范圍。目前Function Call 功能已經(jīng)加入到GLM-Realtime API,將極大拓展技術(shù)在商業(yè)場景中的實(shí)用性。
目前GLM-Realtime API已經(jīng)上線智譜開放平臺(tái)bigmodel.cn,對(duì)標(biāo)GPT-4o的意味十足,而且現(xiàn)階段可以免費(fèi)調(diào)用。
比如集成到智能眼鏡、陪伴娃娃等產(chǎn)品中,相當(dāng)于有了“嘴巴和眼睛”,將重構(gòu)智能硬件的用戶體驗(yàn)。
2、GLM-4-Air能力全面升級(jí),且價(jià)格下降了50%
作為GLM-4 系列的高性價(jià)比版本,GLM-4-Air上線以來受到了很多開發(fā)者的青睞。
這一次,智譜發(fā)布了全面升級(jí)的GLM-4-Air-0111,帶來了顯著提升:通過優(yōu)化訓(xùn)練數(shù)據(jù)和流程,在部分維度上接近 GLM-4-Plus 的性能。
與此同時(shí), GLM-4-Air-0111模型價(jià)格降價(jià)到原來的50%,再次降低大模型應(yīng)用的門檻。
3、升級(jí)版的GLM-4V-Plus,覇榜多個(gè)公開榜單
視覺理解模型GLM-4V-Plus也進(jìn)行了全面升級(jí),新版本在多個(gè)公開榜單上均展現(xiàn)出顯著的效果提升(對(duì)比的對(duì)象不乏Gemini-2.0、GPT-4o、Claude 3.5等美國企業(yè)最新的標(biāo)桿模型)。
支持變分辨率功能:適應(yīng)不同尺寸的圖像,顯著降低小圖場景下的 token 消耗。同時(shí)支持4K超清圖像和極致長寬比圖像的無損識(shí)別。長視頻處理能力:具備長達(dá)2小時(shí)的視頻理解能力,適用于長視頻分析和復(fù)雜場景的精準(zhǔn)識(shí)別。
Case1:大模型色盲檢測
Case2:看圖講故事
4、Flash 系列普惠模型全免費(fèi)
致力于“大模型普惠”的智譜,為助力所有開發(fā)者更便捷地利用大模型進(jìn)行創(chuàng)新,專門設(shè)置了針對(duì)全社會(huì)免費(fèi)開放 Flash 系列普惠模型 API,涵蓋語言、文生圖、文生視頻及圖像理解等多個(gè)場景。
作為行業(yè)首個(gè)全模態(tài)的免費(fèi)系列模型,開發(fā)者可以免費(fèi)調(diào)用語言、多模態(tài)理解、多模態(tài)生成功能。
近期Flash系列也將全面升級(jí),F(xiàn)lash全模態(tài)全家桶成員包括:語言模型 GLM-4-Flash、圖像理解模型 GLM-4V-Flash、圖像生成模型 CogView-3-Flash和視頻生成模型 CogVideoX-Flash。
寫在最后
如果是在三年前,被美國列入出口管制實(shí)體清單,可能會(huì)讓不少企業(yè)誠惶誠恐,現(xiàn)在則要另當(dāng)別論。
一方面,華為在內(nèi)的企業(yè)已經(jīng)證實(shí),所謂的封鎖和打壓并不能阻礙中國科技的創(chuàng)新進(jìn)程,反而會(huì)助推國內(nèi)企業(yè)走向自立自強(qiáng)之路,構(gòu)建出自主可控的技術(shù)、產(chǎn)品和生態(tài)體系。
另一方面,智譜自創(chuàng)立起就選擇了自研路線,并未對(duì)美國的產(chǎn)品和技術(shù)形成深度依賴。被列入“實(shí)體清單”后,勢必會(huì)加速智譜的內(nèi)生研發(fā)進(jìn)程,不斷完善底層能力和產(chǎn)業(yè)合作。
何況,智譜的態(tài)度非常強(qiáng)硬,第二天就發(fā)布了一系列新模型,顯然已經(jīng)做好了用自主創(chuàng)新應(yīng)對(duì)外部壓力的準(zhǔn)備。同時(shí)身體力行地提醒中國科技行業(yè),自主創(chuàng)新能力永遠(yuǎn)是打破封鎖的最佳武器。
2024年是大模型落地應(yīng)用的元年,2025年大模型的落地進(jìn)程將愈演愈烈。
美國在這個(gè)時(shí)候“制裁”智譜,可以說是阻止中國AI產(chǎn)業(yè)創(chuàng)新的又一次嘗試,預(yù)示著大模型行業(yè)正在進(jìn)入新的拐點(diǎn)。
只是就結(jié)果來看,一時(shí)的打壓或封鎖,無法削弱中國AI參與全球競爭的決心。智譜已經(jīng)用行動(dòng)給出了鏗鏘有力的回答:放棄幻想,開始戰(zhàn)斗,中國AI將在自力更生的路上越走越遠(yuǎn)。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無評(píng)論哦,快來評(píng)論一下吧!
全部評(píng)論(0條)