算力服務網絡:一場多元融合的系統革命
東數西算工程啟動小半年后,算力服務網絡的概念正在加速升溫,頻頻成為行業論壇上的討論焦點,參與者也越來越多。
按照一些算力白皮書中的說法:要推動算力像水電一樣,可以“一點接入、即取即用”。想要達成“算力無所不在、網絡無所不達、智能無所不及”的遠大愿景,就需要算為中心、網為載體、多要素融合的算力服務網絡。
“算力服務網絡”的本質似乎并不復雜,即通過系統化的方式解決算力的需求和供給問題。只是在算力成為水電一樣的基礎設施的過程中,仍然有很多待解的問題,有很多棘手的挑戰,很多未知的探索和試錯。
而能否找到一條正確的路徑,直接關系著算力服務網絡的底色。
01 單一算力or多元算力
算力服務網絡的概念很熱,可外界對算力服務網絡的定義尚未統一。
不同企業對算力服務網絡的定義并不相同。有人理解為人工智能算力中心的聯網調度,也有人將算力服務網絡視為云化網絡的演變……現階段仍處于自圓其說的“狹義”階段,潛移默化地混淆了算力服務網絡的認知。
算力服務網絡作為一個新興概念,上下游的參與者不計其數,不排除一些企業或個人存在認知上的局限性,遵循傳統的思維定式去理解新事物。可回到算力服務網絡的初衷,左右行業潮向的可能不是哪一家企業,甚至不是哪一個機構,而是真實存在的市場需求,市場需要什么樣的計算服務,深切影響著算力服務網絡的內涵。
中石油BGP處理中心原總工程師賴能和在2022中國算力發展研討會上,談及油氣勘探的算力需求:油氣勘探簡單地說就是給地表做CT,一個項目的原始數據往往超過100TB,甚至有些項目的原始數據超過1個PB,就需要巨大的算力作為支撐。由于油氣勘探是個龐大的系統工程,流程常常由幾百個模塊組成,整體的算力要求很高,且每個模塊的算力需求、運行精度等也有所不同。
賴能和在石油勘探中遇到的問題,無疑為算力服務網絡服務提供了一個重要啟示:在真實的應用場景中,對算力的需求絕非是單一的,而是多元算力的融合,涉及到不同的計算場景、不同的計算架構。
有別于電力服務中的統一標準,不同行業、不同領域、不同場景、不同企業對算力的需求并不完全相同,以至于算力需求可以細分為幾百上千種。同時CPU算力、GPU算力、專用芯片產生的算力,不僅計算架構不同,算力的精度也不同。算力服務網絡的出現,絕不是基于算力屬性的連網,而是輸出多元融合的算力。
倘若只是將單一的智算或超算編織成網,或許可以滿足客戶在特定場景下的需求,可不同算力平臺的接口不規范、調用方式不統一、互相不兼容,等同于人為制造了一個個新的煙囪系統,客戶需要花費額外的精力進行適配打通,以解決底層數據的互聯互通問題,儼然違背了算力服務網絡的初衷。
也就是說,算力服務網絡的正確理解應該是多元算力的融合,是一項AI、Big Data、HPC深度融合調度的系統工程。一個算力服務網絡既要容納多元化的算力,滿足不同業務場景的算力需求,也要改變傳統的服務范式,按需按量為客戶提供計算、應用、數據、調優、咨詢、運營、運維等一站式服務。
02 算力服務網絡的“三座大山”
厘清了算力服務網絡的價值,還需要正視算力服務網絡面臨的挑戰。
就像水電之所以在日常生活和工業生產中扮演了不可或缺的角色,離不開國家電網等企業鋪設的一張張密密麻麻的電力網。算力服務網絡所肩負的使命,正是讓客戶能夠像購買電力一樣購買算力服務“套餐”。
算力服務網絡的愿景不可謂不明確,可想要將理想中的愿景變成現實,現階段至少存在三個方面的挑戰。
首先是算力分布的不均衡。
算力不是基礎的自然資源,對電力有著極高的依賴性,而國內的電力資源又有著東西部分布不均衡的特點。再加上不同行業、不同領域對算力的需求不同,導致數據中心的分布出現了行業、區域、領域的分布不均,國內計算產業的復雜程度和局限性,已然超過了水和電。東數西算工程想要解決的就是這一問題,也因此經常與西氣東輸、南水北調等大型工程相提并論。
然后是算力資源的不標準。
電力服務中雖然存在380V、220V、110V等不同的電壓,仍然可以用“多少度電”描述對電力的需求量,但算力服務中類似的標準還比較模糊,用戶很難精準把握需要多少FLOPS的算力。算力服務網絡需要同步解決標準化的問題,不斷優化算力的度量衡,結合傳輸、存儲等服務的不同需求,對波峰波谷不同時間的算力差異化定價。同樣是一個非常復雜的系統級工程。
再次是算力供需的不匹配。
隨著數字化轉型的持續深入,算力需求正在加速迭代:數據量負載從單一負載轉向混合負載、應用場景也在經歷簡單到復雜的演變。即使是工程量不算龐大的圖像訓練,就包括數據轉發、壓縮存儲、加密解密、文件系統、數據查詢、圖像渲染等對個計算模塊,涉及到多種芯片的算力,一些長尾且剛需的計算場景,可能還需要提供定制的專屬服務。
做一個總結的話,將分布在國內各地的數據中心進行統籌和連接,不過是算力服務網絡的第一步,能否通過算力調度系統合理調配、協調一致地提供算力服務,能否基于場景需求向市場輸出算力、算法、數據、應用高度協同的一體化資源,同樣是算力服務網絡服務商必須要應對的問題。
算力服務網絡的根基不在于有多少家企業參與,而是有沒有專業的機構或團隊對算力服務網絡進行標準化、精細化的管理,跳出某項業務升級為算力服務網絡的思維陷阱,通過專業的算力服務為數字產業提速增效。
03 算力生態正照進現實
沿循這樣的邏輯,算力服務網絡的進化可以粗略分為兩個階段。
第一個階段是平臺化,目的是降低算力服務的成本和門檻,就像是一條條高壓線將電力輸送給一家家工廠;第二個階段是生態化,也是目前計算市場所處的階段,目的是產業鏈協同釋放計算服務的內生力量。第一階段解決了算力服務網絡的“可用”問題,第二階段則是算力服務網絡“好用”的不二法門。
借用中國信通院云計算與大數據研究所所長何寶宏的觀點:算力的資源描述、管理、調度和分配,不單單是技術問題,要構建面向市場的經濟型的生態,如果沒有面向市場的激勵機制,沒有經濟運算系統,這個事情是做不成的。目前已經有企業在做算力的輕結算,也出現了一些方法和工具,仍然有很多問題需要探討。
中科曙光副總裁曹振南有著同樣的洞察:光有算力并不能產生價值,只有把應用支持好、服務好才能發揮它的價值。比算力平臺更重要的是做好算力生態,譬如建立上下游互利共盈的商業模式。
這些業內專家的觀點,傳遞出的不僅僅是一線參與者對算力服務網絡的思考,也再度印證了ABC融合的趨勢,即算力服務網絡整合的除了多元化的算力,還應包括存儲、網絡、數據等分散性的資源,以資源池的方式重構算力服務的基礎設施,并通過開放API等方式鏈接上下游伙伴形成廣闊的生態。
其中的底層邏輯在于,算力想要進一步和生產力劃上等號,勢必要和應用產生更加緊密的聯系。農業時代的水力、工業時代的電力、信息時代的網絡……這些在人類文明史中留下了濃墨重彩的通用技術,無不依賴于形形色色的應用。
算力“網絡”在某種程度上解決了算力的需求和供給,但在算力交付給用戶并產生價值的過程中,需要算力提供商、基礎軟件提供商、應用軟件開發商、數據提供商、設計方、用戶等上下游的共同參與,尤其是那些有能力將算力服務開放出去的實力派,不應缺席對應用場景的滲透。
其實也為我們提供了一個新的視角,在算力服務網絡方興未艾的當下,衡量一家企業競爭力的標準,應該上升到多元化算力的調度能力、一體化的算力運營力以及生態整合的綜合能力,這是連接算力價值的必備因素,也是算力服務網絡爭奪賽的勝負手。
當然,任何生態都不是一朝一夕形成的,現階段算力服務網絡被討論最多的可能還是“削峰填谷”技術為核心算力按需調度,但對賽場上的玩家們來說,需要有腳踏實地的耐心,也需要有仰望星空的信心。
04 寫在最后
按照中國信通院的測算,算力發展指數每提高一個點,GDP增長約為1293億元,占到整個GDP的1.3‰。算力規模和經濟增長所呈現出的正相關關系,無疑為計算產業的蓬勃發展埋下了伏筆。
何況十四五規劃和2035年遠景目標中早已明確提出:“加快構建全國一體化大數據中心體系,強化算力統籌智能調度。”在國內經濟換擋增長的窗口期,一場系統性的計算服務革命幾乎是可以預期的結果。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)