國產大模型,到底行不行?
1
現在是個公司都在討論做大模型。
按定義上說,大模型是需要大量訓練數據和計算資源,依賴動輒上億乃至數十億的模型參數和大量層數來實現高性能的模型。
但萬萬沒想到,加了這么多定語,硬是沒給廠商們的想象力定住,這兩年,不對,這幾個月光國內就出了幾十個所謂的大模型,互聯網世界沉浸在一片豐收的喜悅中。
你別管怎么模的,你就說型不型吧。
別管能活幾個,就說這個大模型適不適合中國寶寶的體質吧。
我思考了很久,我覺得這個味兒好熟悉,后來我發現同樣的故事上一次叫元宇宙,上上次還是區塊鏈。
這時我就開始懷念大家做O2O時候的樣子。
雖然最后也就那樣,但那個時候人與人之間真的好純粹,錢是真的燒,打法也是真的燒。
要押金的那批除外。
2
問題來了,雖然都在吹牛,但大家為啥爭大模型這個風口?
是因為看到了一個機會。
這東西很有可能成為你未來使用的最基礎工具,就像你現在用word工作,用搜索引擎獲得信息一樣,它會成為你生活方式的一種。
爭的是風口嗎,那是未來生活定義權的入口。
那這東西的難點在哪兒?
甭管你是什么大模型,核心都繞不開兩個問題。
其一,訓練模型的高質高量的數據從哪里來;
第二,你訓練出的大模型在哪里能用的上,應用場景是什么。
前者是個技術難題。
數據不但要高質高量,還要合理合法,而且面對這個量級的數據,不僅要有復雜度上天的ETL(我以前工作最討厭的事情就是洗數據整數倉),還需要配備大量的算力,最后還要考慮如何再將大模型部署到線上保證性能。
后者是個變現難題。
大模型好不容易訓練成功了,找不到應用的場景,那這更白玩了。
你有屠龍技,但大家不需要屠龍,那最后就只有一條龍服務了。
這兩個問題太沉重了,根本不是朝生夕死的廠商們該考慮的問題。
是,我搞出技術紅利了,就等著量變引起質變了,只要幾年,我就改變世界了。
沒錯,謝謝你,大家會把好消息燒給你的。
行業小玩家根本燒不起,家人只需要看到燒錢后的債務情況,只要幾分鐘,就能改變婚姻狀態。
所以現在這么多廠商都在搞大模型,爭先入局燒錢,真正能堅持到最后的,還是少數。
評價大模型能不能走得遠,把AI紅利兌現了,其實就三條標準——有沒有看得見摸得著的真實應用案例,有沒有能夠規模化推廣應用的產品,有沒有統計數據能夠證明的應用成效。
不然都是吹的。
也就是說,面對國企、央企等G端用戶,大模型圍繞著需求進行針對性的私有化部署;
面對B端用戶,能將AI能力結合到企業生產各環節中,實在地幫助提升效率;
面對C端,能夠利用已經成型的市場渠道和消費者對品牌的認知,提高消費者的使用頻次,進行流量轉化。
跨過這三關,路才能走穩。
當然,在走穩以后,我還想再補充上一條隱形門檻。
人類能夠誕生文明,形成國家,都依賴于語言,語言才是誕生智能的前提。
廠商一定要對語言模型有扎實的研究,大模型才具備較強的泛化能力,將來大模型才能方便不同國家不同民族、不同專業人士應用于各自的領域。
有了這個能力,故事才能講得真正性感。
3
昨天,科大訊飛舉辦了一場成果發布會,介紹了訊飛星火認知大模型。
主打的,就是開放,大規模開放,所有用戶都可以使用。
發布會現場上,星火認知大模型不講虛話,直接實測了文本生成、語言理解、知識問答等七大維度能力,還順便做了數學題,給大家漏了一小手。
這七大維度和481項細分任務類型,將構成科學的大模型評測體系。
大模型行不行,咱評測后看。
會場上別的能力不贅述了,我覺得與大部分上班族真正利益相關的,還要數星火大模型的一鍵成稿能力。
當你在辦公室里開完兩個小時會議后,不需要再加班花兩個小時重聽一遍整理文稿了,打開訊飛聽見輸入音頻后,大模型會幫你分析文字內容,一鍵輸出摘要,代辦事項,工作計劃等內容,直接文字形式給你安排得明明白白;
如果你趕時間,給它一分鐘,面對老板,它能智能生成新聞稿件這類通稿;
面對消費者,它能生成宣傳文案;你要面對老外,它還能生成多語種版本。
就一分鐘,寫的事兒它來,摸魚的事兒你來,老板還得夸你一句真努力。
就直接說吧,會議紀要,是不是大家日常的剛需以及痛點?
再延伸一下,依據大量會議紀要,生成周報月報,是不是效率越高越好?
別扯啥改變世界,先讓社畜過得舒服點才是硬道理。
訊飛的態度很堅決,號稱今年三次升級后,會在十月整體趕超國外對手。
不成功,就成梗。
4
訊飛這番操作,我很震驚,但毫不意外。
首先從技術層面上,訊飛就有保障;
論算法,訊飛在Transformer深度神經網絡算法方面擁有豐富經驗,在語音識別和圖文識別方面水平過硬,在認知智能領域,訊飛僅去年就獲得了常識閱讀理解挑戰賽OpenBookQA等13項世界冠軍,開源了六個大類,超過40個通用領域的系列中文預訓練語言模型;
講數據,訊飛在嚴格遵守適用法律法規前提下,在多年認知智能系統研發推廣中積累了超過50TB的行業語料和每天超10億人次用戶交互的活躍應用。
注意,是,每天。
在算力方面,訊飛總部自建了業界一流的數據中心,在工程技術方面實現了百億參數大模型推理效率的近千倍加速,訊飛也與華為強強聯合,大模型建立在安全可靠的國產算力平臺之上的。
就這三個BUFF一疊,技術不過硬才有問題。
技術有了依靠,訊飛的1+N架構則是將大模型變成了這個1——通用認知智能大模型。
AI技術常年應用于N個一線領域,要論開放,訊飛知道如何更好地推出各領域的專用大模型版本。
比如辦公領域,訊飛AI學習機等多項C端教育產品為消費者提供了新穎的交互體驗,訊飛智能辦公本和訊飛聽見也幫助職場人士提升了工作效率。
比如汽車領域,訊飛打造的搭載大模型的智能座艙,能實現擬人化的溝通;
比如發布會現場展示的人機交流過程,智能座艙能在幫你安排接聽公司電話并將對話內容發送到手機的同時,還能幫你哄孩子,解決孩子一個又一個天馬行空的問題。
鋪墊了這么多年,這次只能說是厚積薄發,偷偷給你開個大。
本次大規模開放訊飛星火認知大模型,對用戶來說,是好事。
功能就在那里,你用了就能簡單直接地感受效率提升,跟大模型合作久了,你自己也知道面對問題如何拆分自己的需求,將來要構建怎樣的智能生活,你也有話講;
對訊飛來說,通過百行千業的用戶在一次次實踐過程中的真實交互,這些寶貴高質量的反饋也在幫助訊飛進行人工標注,加快訊飛星火認知大模型迭代的過程,實踐出真知。
你不用擔心這是一場作秀,一場倉促的表演。
星火二字的由來,就是科大訊飛的決心,“要么熄滅,要么燎原”,這句話就被刻在訊飛總部大樓的墻面上。
二十四年前一群中科大的大學生喊出了,要把中文語音做到世界最好。
訊飛從學界做到產界,從輸入法做到翻譯機,一直深耕于語音語義領域,到如今早就對于認知智能有了獨到的理解和布局,未來關于“如何定義智能”這個終極目標,相信訊飛能擁有獨到的見解。
取火,要很久。
燎原,只要一瞬間。
5
星星之火可以熄滅,也可以燎原。
親吻足下大地,才能回報火焰。
大模型只是訊飛走出的關鍵一步,圍繞著大模型,訊飛還會貫徹一個戰略和一個計劃。
戰略是,訊飛會進一步推進訊飛開發平臺2.0,星火認知大模型是一把關鍵的鑰匙,由行業龍頭自己掌握,最后大家一起創造出一個行業通用大模型解決方案。
計劃是,訊飛推出了AI星火營生態計劃。
首先是從現在起,以星火大模型開放源頭技術能力,幫助創新應用更好落地,通過訊飛定期舉辦的AI開發者大賽,幫助優秀開發者團隊產學聯動,招商引智,培養人才后備軍。
訊飛擁有幾百萬開發者,撬動大模型落地,未來所有的硬件和所有的APP都要在大模型上迭代更新,真正做到眾智眾創。
其次是通過訊飛開放平臺旗下AI產供銷一體化平臺“訊飛AI服務市場”,為大模型上中下游企業提供從品牌、管理、經營的全棧服務,解決需求。
最后,是通過科大訊飛生態平臺的“星火營·創業營”項目,幫助各地創業團隊搭建產業資源和資本資源的對接平臺,讓創業團隊和產業方資本方快速對接,做好平臺。
三步走完,大模型才不是一場自嗨的表演,而是技術進步的狂歡。
不僅如此,訊飛的能力還會開放給羚羊工業互聯網平臺,幫助各行各業,對外合作。
大模型作為技術底座,通過開放平臺幫助各個合作伙伴跨越技術壁壘時,整個人工智能開發生態才能欣欣向榮。
中國的人工智能,由中國人定義。
未來會變成什么樣,其實沒有人能猜到。
但總歸是要做的。
當所有星火閃耀起來的那一刻,正是文明閃耀之時。
好不好,總得試試才知道。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)