從“紙面算力”到“好用算力”,超聚變打通AI+“最后一公里”
如果要評(píng)選2024年的年度科技名詞,AI+當(dāng)屬最熱門的候選項(xiàng)。
年初的《政府工作報(bào)告》中首次提出了“人工智能+”行動(dòng),正在從頂層設(shè)計(jì)著手,加快形成以人工智能為引擎的新質(zhì)生產(chǎn)力。
折射到市場層面,AI+作為一種新的范式,不斷深入千行萬業(yè)。金融、醫(yī)療、制造、交通、智慧城市等各行各業(yè)都在掀起一場智能革命,通過AI和算力的結(jié)合挖掘新質(zhì)生產(chǎn)力,不斷釋放出創(chuàng)新的乘法效應(yīng)。
同時(shí)也遇到了一些待解的難題,比如作為基礎(chǔ)設(shè)施的AI算力:當(dāng)AI成為場景革新的驅(qū)動(dòng)力量,算力環(huán)節(jié)如何破局?
剛剛結(jié)束的2024年中國算力大會(huì)“AI+,釋放算力新價(jià)值”論壇上,來自超聚變、中國電信、滴普科技、百度、英特爾等算力產(chǎn)業(yè)上下游的廠商,以及人工智能領(lǐng)域的院士和專家,深入探討了AI算力的現(xiàn)狀和趨勢(shì)。
也讓我們看到了問題的答案。
01 打破算力瓶頸,行業(yè)需要“好用算力”
“AI+各行各業(yè)”不是簡單的兩者相加,而是要利用數(shù)據(jù)、算力、算法等智能要素,催生出新的業(yè)態(tài)和增長動(dòng)能。
借用一個(gè)形象的比喻:AI+就好比是做飯,算法是鍋、數(shù)據(jù)是米、算力是火。特別是在“算法跟著算力走”的背景下,算力已經(jīng)可以在某種程度上和生產(chǎn)力劃等號(hào),算力強(qiáng)則AI強(qiáng),算力不足,AI就會(huì)掉鏈子。
現(xiàn)實(shí)情況卻是,AI算力的瓶頸在2024年依舊存在。
一是算力缺口的加劇。
參考美銀等機(jī)構(gòu)的報(bào)告:大模型進(jìn)入到萬億參數(shù)時(shí)代后,對(duì)算力的需求達(dá)到了每年750倍的指數(shù)級(jí)膨脹,而目前的硬件算力供給只有3倍每兩年的增速,供需缺口正在隨著時(shí)間加劇。
也就意味著,讓無數(shù)企業(yè)頭大的“算力焦慮”,在時(shí)間的作用下將只增不減,同時(shí)也在拷問當(dāng)前的算力供給方式:僅僅只是在數(shù)量上做文章,永遠(yuǎn)填不滿各行各業(yè)的算力缺口,必須要思考怎么提升智能算力的效能。
二是算力亟需綠色化。
馬斯克和黃仁勛都曾抱怨“算力的盡頭是電力”,之后就傳出了“微軟算力中心搞崩了電網(wǎng)”的新聞。按照國際能源署的預(yù)測,2026年數(shù)據(jù)中心、人工智能等行業(yè)的電力消耗將達(dá)到1000太瓦時(shí)以上,增速是全球用電量的數(shù)十倍。
在這樣的語境下,綠色智算所涉及的不單單是環(huán)保議題,能否在綠色智算的布局上未雨綢繆,給出可行的創(chuàng)新解決方案降低功耗,直接關(guān)系著下一個(gè)十年的算力供給能力,左右著AI+在各行各業(yè)的融合進(jìn)程。
三是算力應(yīng)用的困境。
沒有汽車工業(yè)的繁榮,石油不過是廉價(jià)的燃料。同樣的邏輯也適用于AI,倘若不能在應(yīng)用層降低門檻、疏通堵點(diǎn),使能各行各業(yè)的開發(fā)者高效打造AI原生應(yīng)用,所謂的算力價(jià)值也就無從談起。
目前AI應(yīng)用還處于試點(diǎn)階段,想要走向規(guī)模化落地,面臨著算力、模型、應(yīng)用等不同層級(jí)的痛點(diǎn)。比如算力的單一和兼容性問題,尤其是在模型推理的多元算力需求下;大模型調(diào)用的高門檻,模型和算力資源的匹配就勸退了不少開發(fā)者;以及應(yīng)用開發(fā)時(shí)面臨缺少工具鏈、開發(fā)效率低等挑戰(zhàn)。
AI算力的瓶頸是否無解呢?答案是否定的。
2024年中國算力大會(huì)“AI+,釋放算力新價(jià)值”論壇上,超聚變?nèi)騇arketing與銷售服務(wù)部總裁、算力事業(yè)部總裁張小華道出了行業(yè)上下游的一個(gè)共識(shí):推動(dòng)算力從“紙面算力”到“可用算力”再到“好用算力”的轉(zhuǎn)換。
簡而言之,AI算力既要增量,也要提質(zhì)。
正如超聚變算力領(lǐng)域與拓展部總裁唐啟明在演講中提到的:“面向AI算力,超聚變正在重構(gòu)基礎(chǔ)設(shè)施、跨越生態(tài)裂谷,逐步推向行業(yè)落地,通過縱向做深構(gòu)筑競爭力,橫向擴(kuò)展以IT賦能OT,和伙伴一起共促AI算力產(chǎn)業(yè)繁榮。”
超聚變指出了方向,也給出了可行的路徑。
02 告別能耗魔咒,構(gòu)建“綠色”智能算力
首先要解決的就是綠色智算。
為了解決算力資源分布不均衡的情況,國家在2022年初啟動(dòng)了“東數(shù)西算”工程,將東部的算力需求有序引導(dǎo)到西部,發(fā)揮西部的自然氣候和電力優(yōu)勢(shì),通過算力資源的跨域調(diào)配,解決算力中心的能耗壓力。
可隨著大模型推理需求的爆發(fā),對(duì)時(shí)延的要求越來越高,不少城市開始建立城市級(jí)、區(qū)域級(jí)的智算中心,以滿足不斷增長的推理算力需求。但在智算中心的建設(shè)上,并沒有盲目上馬,紛紛畫出了能耗紅線。
比如工信部等六部門在《工業(yè)能效提升行動(dòng)計(jì)劃》中提出:到2025年,新建大型、超大型數(shù)據(jù)中心電能利用效率(PUE)要優(yōu)于1.3;北京、上海、深圳、杭州、廣州等城市先后對(duì)新建數(shù)據(jù)中心提出了嚴(yán)格要求,其中深圳已明確鼓勵(lì)PUE值低于1.25的數(shù)據(jù)中心。
正如外界所熟知的,PUE值越接近1,表明非IT設(shè)備的耗能越少,數(shù)據(jù)中心的能效水平越高。目前國內(nèi)大型數(shù)據(jù)中心的平均PUE值為1.55,超大型數(shù)據(jù)中心平均PUE值也只有1.46,意味著能耗只有一半用在了“計(jì)算”上,其他的則浪費(fèi)在了散熱、照明等方面。
對(duì)于智算中心分布密集的一二線城市,能否在自然氣候不占優(yōu)勢(shì)的前提下,降低智算中心的PUE值呢?
2024年中國算力大會(huì)上,超聚變的FusionPoD for AI 新一代全液冷整機(jī)柜GPU服務(wù)器斬獲了“算力中國·年度重大突破成果”。在主辦方公布的獲獎(jiǎng)理由里,除了在算力密度、海量數(shù)據(jù)訪問上的出色表現(xiàn),散熱和供電能力的權(quán)重同樣不可小覷:100%全液冷散熱搭配105kW高效集中供電,讓PUE低至1.06,5年TCO(總成本)降低15%以上,可以說是當(dāng)下綠色智算的首選方案。
可以佐證的是,目前超聚變液冷服務(wù)器的出貨量已經(jīng)達(dá)到70000+節(jié)點(diǎn),其中和浙江電信聯(lián)合創(chuàng)新的端到端完整的數(shù)據(jù)中心液冷解決方案,采用了FusionPoD for AI整機(jī)柜液冷服務(wù)器規(guī)模部署,在有“中國四大火爐”之稱的杭州,實(shí)現(xiàn)了極致能效和超低PUE。
一個(gè)不應(yīng)被忽略的消息在于,超聚變?cè)?024年中國算力大會(huì)上發(fā)起成立了“液冷AI開放聯(lián)盟”,將致力于構(gòu)建標(biāo)準(zhǔn)化的智算底座,讓產(chǎn)業(yè)用戶可以更快、更易、更好地獲取和使用AI算力。
言外之意,基于液冷AI開放架構(gòu)的“綠色算力”,在接下來一段時(shí)間里,每年都會(huì)成倍提升。
開源證券等第三方機(jī)構(gòu)也在報(bào)告中預(yù)測了綠色智算的趨勢(shì):AIGC正驅(qū)動(dòng)智算中心朝高密度、低PUE發(fā)展,2022年到2027年中國液冷數(shù)據(jù)中心市場將保持59%的復(fù)合增長率,2027年市場規(guī)模將突破千億大關(guān)。
把以上信息做個(gè)歸納的話,智算中心告別能耗“魔咒”,已經(jīng)是一種現(xiàn)在進(jìn)行時(shí),一種行業(yè)主旋律。
03 軟硬件協(xié)同,打通AI+“最后一公里”
綠色智算加速了“可用算力”進(jìn)程,距離“好用算力”還有多遠(yuǎn)呢?
作為算力基礎(chǔ)設(shè)施與服務(wù)領(lǐng)域的“塔尖”選手,超聚變已經(jīng)給出了自己的回答:
南向創(chuàng)新提升智算效能。
不只是前面提到的FusionPoD for AI全液冷整機(jī)柜GPU服務(wù)器,還包括開箱即用的超聚變超融合訓(xùn)推一體機(jī)等產(chǎn)品,同時(shí)推出了AI Space大模型加速引擎,借助模型遷移、適配和調(diào)優(yōu)能力來提升智算效能。
北向使能AI融入現(xiàn)有業(yè)務(wù)。
直接的例子就是2024年中國算力大會(huì)上發(fā)布的超聚變FusionOne Al解決方案,圍繞AI落地在算力、模型、應(yīng)用等環(huán)節(jié)的痛點(diǎn),提供了三大核心能力,進(jìn)而縮短從算力到應(yīng)用的距離,加速AI融入業(yè)務(wù)。
在算力層,超聚變打造了兼容多元AI算力、異構(gòu)算力的XPU資源池,瞄準(zhǔn)了行業(yè)普遍存在的痛點(diǎn):在實(shí)際業(yè)務(wù)中常常需要CPU、GPU、FPGA、NPU等多種算力,被迫部署不同架構(gòu)的服務(wù)器。
超聚變通過XPU資源池的方式,可以廣泛兼容intel、AMD、NVIDIA、昇騰、摩爾線程等多種異構(gòu)算力,并在智能調(diào)度的幫助下實(shí)現(xiàn)了50%有效算力提升,助力客戶在推理算力上“一次投資,持續(xù)演進(jìn)”。
在模型層,超聚變的模型工程涵蓋了開源和第三方商用模型、場景化數(shù)據(jù)集,以及測試、聯(lián)調(diào)、發(fā)布、部署、管理在內(nèi)的模型使能工具和算子加速,進(jìn)一步降低了大模型微調(diào)開發(fā)和推理上線的技術(shù)門檻。
以大模型與算力資源的匹配為例,在傳統(tǒng)流程中,工程師需要根據(jù)模型的需求調(diào)整算力資源,在模型的計(jì)算需求與可用的硬件資源之間找到一個(gè)平衡點(diǎn),對(duì)經(jīng)驗(yàn)和能力的要求非常高,超聚變的解法是“模型與算力資源自動(dòng)按需匹配”。
在應(yīng)用層,超聚變提供了數(shù)據(jù)工程、知識(shí)庫、插件在內(nèi)的全周期AI工具鏈,并配備了專業(yè)的AI服務(wù)團(tuán)隊(duì),前者旨在降低AI原生應(yīng)用開發(fā)的門檻,后者對(duì)應(yīng)的是100多位經(jīng)驗(yàn)豐富的AI工程師。
個(gè)中邏輯并不難解釋。相較于算力和模型,應(yīng)用直接和客戶的生產(chǎn)力掛鉤,在AI+方興未艾的氛圍下,只有打通AI+的“最后一公里”,讓算力的價(jià)值照進(jìn)現(xiàn)實(shí),讓各行各業(yè)看到AI+的“倍增效應(yīng)”,整個(gè)產(chǎn)業(yè)才會(huì)有序向上生長。
目前FusionOne Al解決方案已經(jīng)服務(wù)超聚變的主流業(yè)務(wù)場景,覆蓋了4000+員工、10000+合作伙伴,生成了百萬行代碼,實(shí)現(xiàn)80%以上的效率提升……超聚變軟硬件協(xié)同釋放算力新價(jià)值的解法,已經(jīng)得到了驗(yàn)證。
每次提到AI+的時(shí)候,總有人想要尋找殺手級(jí)應(yīng)用或者iPhone時(shí)刻,或許最正確的方式恰恰是像超聚變這樣,解決AI+的一個(gè)個(gè)痛點(diǎn)和堵點(diǎn),讓智能算力潤物細(xì)無聲地“滋潤”各行各業(yè)的每一個(gè)場景。
04 寫在最后
誠如2024年中國算力大會(huì)所呈現(xiàn)的, 一個(gè)AI驅(qū)動(dòng)的美麗新世界在算力時(shí)代變得越來越清晰。
通往“新世界”的道路上,有挑戰(zhàn),有機(jī)遇,還有一群默默“鋪路”的技術(shù)人。有理由相信,超聚變和伙伴們的聯(lián)合創(chuàng)新,將重塑算力新格局、釋放算力新價(jià)值,點(diǎn)亮千行萬業(yè)的數(shù)智化之路。
在AI+的浪潮下,城市將變得更加智慧、安全,企業(yè)將更加高效、充滿活力,生活將更加便捷、充滿想象。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無評(píng)論哦,快來評(píng)論一下吧!
全部評(píng)論(0條)