新增市場(chǎng)份額超30%，昇思MindSpore成為AI框架的新選擇

原創(chuàng) 贊收藏 評(píng)論

舉報(bào) 2024-12-17

掃描,分享朋友圈

2024年是大模型落地應(yīng)用的元年。

開發(fā)者們不再迷戀于“大練模型”，而是將大模型裝進(jìn)了手機(jī)、帶到了課堂、融入的生產(chǎn)線、賦能到城市管理……大模型和場(chǎng)景的深入融合，不單單釋放出了新質(zhì)生產(chǎn)力，還默默重構(gòu)著產(chǎn)業(yè)上下游的格局。

12月14日的昇思人工智能框架峰會(huì)上，昇思MindSpore開源社區(qū)理事長丁誠向外界公布了一組新數(shù)據(jù)：昇思MindSpore AI框架開源版本的下載量已經(jīng)超過1100萬次，覆蓋全球130多個(gè)國家和地區(qū)的2400多個(gè)城市；3.7萬多名開發(fā)者參與社區(qū)貢獻(xiàn)，累積代碼提交10萬多行。

同一時(shí)間，中國科學(xué)院科技戰(zhàn)略咨詢研究院預(yù)測(cè)，中國AI框架2024年新增市場(chǎng)昇思份額將達(dá)30%。而根據(jù)IT行業(yè)的市場(chǎng)規(guī)律，一個(gè)AI框架的市場(chǎng)份額超過30%，意味著可能成為事實(shí)上的行業(yè)共識(shí)，將逐步形成完善的產(chǎn)業(yè)生態(tài)，進(jìn)而推動(dòng)技術(shù)更快的落地。

問題在于，為何昇思MindSpore會(huì)成為新增市場(chǎng)份額超過30%的AI框架，又將對(duì)大模型的落地應(yīng)用產(chǎn)生什么樣的影響？

01 立足開源開放，3.7萬名貢獻(xiàn)者撐起的繁榮生態(tài)

一個(gè)AI框架是否好用，開發(fā)者生態(tài)是不可或缺的一環(huán)。

時(shí)間回到2020年3月28日，昇思MindSpore AI框架正式開源。時(shí)值國內(nèi)深度學(xué)習(xí)框架的“春天”，不少企業(yè)都推出了自己AI框架，不乏同樣采取開源路線的玩家。不同的是，昇思MindSpore在開源之外，還著手構(gòu)建了一套完整的人才培養(yǎng)和社區(qū)治理體系。

先說人才培養(yǎng)。

當(dāng)外界普遍抱怨AI人才難覓的時(shí)候，昇思MindSpore開源社區(qū)悄悄構(gòu)建了一套面向開發(fā)者分層分級(jí)的社區(qū)學(xué)習(xí)和發(fā)展體系。

第一階段是學(xué)習(xí)，社區(qū)提供了30多門系列主題課程，600多場(chǎng)線上線下專題活動(dòng)，每年20多場(chǎng)創(chuàng)新訓(xùn)練營等專場(chǎng)賦能，目的是幫助每一個(gè)對(duì)AI有興趣的開發(fā)者，掌握人工智能相關(guān)的技術(shù)知識(shí) ；

第二階段是實(shí)踐，開發(fā)者熟悉了AI相關(guān)的知識(shí)后，通過以賽促學(xué)、以練促學(xué)的方式，幫助開發(fā)者在實(shí)踐中提升。目前昇思MindSpore開源社區(qū)已經(jīng)發(fā)布了1100多個(gè)實(shí)習(xí)任務(wù)、舉辦了30多場(chǎng)大賽；

第三階段是創(chuàng)新，當(dāng)開發(fā)者充分掌握AI技能后，借助專項(xiàng)學(xué)術(shù)論文基金、社區(qū)項(xiàng)目支持等方式，為開發(fā)者提供創(chuàng)新資源和成果激勵(lì)。比如CAAI-昇思學(xué)術(shù)基金、鯤鵬昇騰科研創(chuàng)新使能計(jì)劃等等；

第四階段是影響，對(duì)于成長起來的開發(fā)者，昇思MindSpore開源社區(qū)正在通過開發(fā)者/布道師認(rèn)證、邀請(qǐng)加入SIG組和技術(shù)委員會(huì)等方式，幫助開發(fā)者提升影響力，同時(shí)以社區(qū)布道、答疑解惑等形式回饋社區(qū)。

再來說社區(qū)治理。

2023年6月的人工智能框架生態(tài)峰會(huì)上，昇思MindSpore與18家AI頂尖企業(yè)、學(xué)會(huì)、高校與科研院所聯(lián)合發(fā)布了《共建人工智能框架生態(tài)倡議》，同時(shí)成立了昇思MindSpore開源社區(qū)理事會(huì)。

其中昇思MindSpore開源社區(qū)理事會(huì)由理事會(huì)單位共同管理、決策和規(guī)劃社區(qū)的整體發(fā)展；技術(shù)委員會(huì)委員看護(hù)整體方案，共同決策社區(qū)的技術(shù)迭代演進(jìn)；SIG組則全面看護(hù)各個(gè)技術(shù)領(lǐng)域，管理日程開發(fā)與維護(hù)，旨在構(gòu)建一個(gè)開放、多元、包容的AI技術(shù)生態(tài)，凝聚多種創(chuàng)新力量。

如果將人才比作種子的話，開源社區(qū)就像是一片肥沃的黑土地，為種子的發(fā)芽、生根、開花、結(jié)果源源不斷的提供養(yǎng)分，最終形成郁郁蔥蔥的森林，成為中國AI產(chǎn)業(yè)向上生長的堅(jiān)實(shí)力量。

可以佐證的是：截止到2024年11月，昇思MindSpore的社區(qū)貢獻(xiàn)者已經(jīng)增長到3.7萬人，一年半的時(shí)間里翻了兩倍；和360多所高校建立了合作，其中290多所高校開設(shè)了昇思MindSpore相關(guān)課程；基于昇思MindSpore AI框架的原創(chuàng)論文發(fā)表累計(jì)超過1700篇，位列全球第二、中國第一；昇思MindSpore獲評(píng)Gitee中國最佳開源貢獻(xiàn)項(xiàng)目，成為Gitee-AI分類下全品類指數(shù)第一……

四年前，昇思MindSpore播下了開源的種子，現(xiàn)在已經(jīng)逐漸長成繁榮的森林。

02 使能大模型創(chuàng)新，AI正在千行萬業(yè)加速落地

開源生態(tài)的價(jià)值在哪里？大模型可以說是最典型的標(biāo)桿。

就產(chǎn)業(yè)布局來說，AI框架有著“承上啟下”的作用。按照中國工程院何友院士的說法：“AI框架南向使能多樣化算力，北向孵化各類算法模型，是人工智能應(yīng)用創(chuàng)新的土壤和源泉”。屬于芯片企業(yè)、大模型廠商、應(yīng)用開發(fā)者等不同角色匯聚的“中樞地帶”，對(duì)大模型落地應(yīng)用的意義不言而喻。

智譜CEO張鵬在昇思人工智能框架峰會(huì)上的演講中提到：智譜團(tuán)隊(duì)在CodeGeeX的訓(xùn)練中，使用的就是昇思MindSpore AI框架，依托昇騰與昇思的多維混合分布式并行技術(shù)等軟硬件能力，大幅改善了模型開發(fā)、訓(xùn)練的效率及模型精度。目前CodeGeeX在開發(fā)者社區(qū)中已經(jīng)有超過百萬的用戶，日活超過了幾十萬。

作為大模型訓(xùn)練的“煉丹爐”，目前昇思MindSpore已經(jīng)支持、孵化了50多個(gè)主流大模型，包括但不限于訊飛星火、通義千問、GLM4、Llama、Baichuan、DeepSeeek、YI等等，通過套件的能力封裝，可以實(shí)現(xiàn)開發(fā)、訓(xùn)練、微調(diào)、部署的全流程開箱即用。同時(shí)有1700多家社區(qū)伙伴，采用昇思MindSpore孵化了2000多個(gè)解決方案，覆蓋互聯(lián)網(wǎng)、金融、能源、交通等15個(gè)行業(yè)。

也就是說，昇思MindSpore開源社區(qū)通過匯聚大模型產(chǎn)業(yè)鏈條中的不同力量，打通了一條大模型開發(fā)、訓(xùn)練、微調(diào)、推理部署的“最佳路徑”，跑通了大模型落地的“最后一公里”，讓創(chuàng)新離產(chǎn)業(yè)更近。

比如南方電網(wǎng)打造的“馭電”電力潮流預(yù)測(cè)大模型。

隨著新能源大規(guī)模并網(wǎng)，電力系統(tǒng)規(guī)劃和運(yùn)行面臨高度不確定性、高度可變性、海量調(diào)度單元、多目標(biāo)和多約束決策等技術(shù)挑戰(zhàn)，傳統(tǒng)的數(shù)值仿真工具已經(jīng)難以滿足需要。

南方電網(wǎng)依托昇思MindSpore AI框架與昇騰AI處理器提供的基礎(chǔ)軟硬件能力，開發(fā)出了全新的仿真工具——“馭電”電力潮流預(yù)測(cè)大模型，通過學(xué)習(xí)電力系統(tǒng)內(nèi)在運(yùn)行規(guī)律，具備了海量運(yùn)行方式生成和新能源承載能力分析等能力，可以在保障電網(wǎng)安全的基礎(chǔ)上最大限度發(fā)揮新能源發(fā)電能力。

再比如昌平實(shí)驗(yàn)室打造的“天工”抗體設(shè)計(jì)模型。

抗體類藥物在病毒引起的傳染病等方面發(fā)揮著重要作用，但傳統(tǒng)的抗體設(shè)計(jì)方法效率低下、成本高昂，無法滿足日益增長的臨床需求。

針對(duì)這些需求與挑戰(zhàn)，昌平實(shí)驗(yàn)室聯(lián)合昇思MindSpore打造了“天工”抗體設(shè)計(jì)模型，能夠?qū)崿F(xiàn)抗體功能設(shè)計(jì)、序列嫁接和活性預(yù)測(cè)等多種任務(wù)，相比傳統(tǒng)抗體設(shè)計(jì)方法提升一個(gè)數(shù)量級(jí)以上。其中基于天工模型嫁接改造得到的人源抗體，經(jīng)協(xié)和醫(yī)學(xué)院團(tuán)隊(duì)驗(yàn)證抗體表達(dá)量提升約5至10倍，有望將抗體生產(chǎn)成本降低2倍以上。

可以找到的例子有很多。

比案例本身更有價(jià)值的，是將大模型落地到千行萬業(yè)的新范式：因?yàn)闀N思MindSpore正在適配越來越多大模型，提供了全流程的大模型開發(fā)套件，一家企業(yè)想要基于自身的業(yè)務(wù)做大模型，不再需要重新開發(fā)，只需調(diào)用套件接口，喂自己的數(shù)據(jù)，調(diào)整參數(shù)，就能開發(fā)自己的行業(yè)大模型。

03 技術(shù)跨越式演進(jìn)，昇思MindSpore成為新選擇

正如前面所提到的，AI框架的作用是“承上啟下”。

不單單是在技術(shù)層面，還涉及產(chǎn)業(yè)上下游的協(xié)作：上游的大模型開發(fā)者，能否進(jìn)一步提高模型訓(xùn)練的效率，將更多的精力集中在模型本身，而非基礎(chǔ)設(shè)施和工具鏈上；下游的應(yīng)用開發(fā)者，能否進(jìn)一步降低學(xué)習(xí)門檻，快速將大模型的能力和場(chǎng)景相融合。

至少就目前來看，AI框架還有不少的挑戰(zhàn)需要解決：

向上解決大模型開發(fā)者遇到的一系列問題，譬如大模型的參數(shù)量、序列長度、模態(tài)結(jié)構(gòu)等指數(shù)級(jí)演進(jìn)，產(chǎn)生了異構(gòu)模型的計(jì)算不均衡、超長序列帶來的內(nèi)存爆炸、模型并行出現(xiàn)流水線空泡等問題；

向下打破大模型落地的重重阻礙，譬如在單模型單任務(wù)走向多模型多任務(wù)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相融合的趨勢(shì)下，多模型協(xié)同交互、推理和強(qiáng)化學(xué)習(xí)任務(wù)混合部署、訓(xùn)推權(quán)重在線轉(zhuǎn)換等挑戰(zhàn)層出不窮。

為什么昇思MindSpore AI框架會(huì)成為開發(fā)者的新選擇呢？我們從丁誠的演講中找到了三個(gè)關(guān)鍵線索。

一是從多個(gè)維度全面兼容業(yè)界主流方案。

考慮到大多數(shù)開發(fā)者在上手使用新框架時(shí)，希望第三方開源樣例可以快速復(fù)現(xiàn)，昇思MindSpore在框架層將兼容300多個(gè)模型網(wǎng)絡(luò)接口、300+算子表達(dá)以及數(shù)據(jù)、權(quán)重等基礎(chǔ)格式，同時(shí)全面兼容了Transformers和Diffusers全流程套件的200多個(gè)接口。

以LLAMA 3-70B的代碼樣例為例，開發(fā)者只需要將命名空間進(jìn)行等價(jià)替換，就可以快速完成腳本復(fù)現(xiàn)。

二是大幅降低大模型端到端的訓(xùn)練成本。

大模型訓(xùn)練的最大痛點(diǎn)無外乎算力和時(shí)間成本，而昇思MindSpore AI框架在設(shè)計(jì)時(shí)就構(gòu)筑了原生的分布式并行能力，同時(shí)針對(duì)稠密模型、萬億參數(shù)的MoE模型、長序列等場(chǎng)景進(jìn)行了針對(duì)性優(yōu)化。

比如隨著集群規(guī)模、并行策略維度的復(fù)雜性持續(xù)增長，并行策略的選取、優(yōu)化也會(huì)帶來巨大的調(diào)試成本，昇思MindSpore將進(jìn)一步通過自動(dòng)搜索、仿真執(zhí)行等能力，讓訓(xùn)練性能調(diào)優(yōu)從周級(jí)下降到了天級(jí)。

三是面向未來場(chǎng)景持續(xù)優(yōu)化框架結(jié)構(gòu)。

面向o1代表的慢思考場(chǎng)景，昇思MindSpore將支持在線權(quán)重重排，使得訓(xùn)推任務(wù)的轉(zhuǎn)換和權(quán)重切分可以無縫銜接；并將RLHF等基礎(chǔ)模塊進(jìn)行封裝，方便高效率實(shí)現(xiàn)算法，端到端提升整體吞吐。

面向AI for Science場(chǎng)景，昇思MindSpore提供了對(duì)數(shù)學(xué)家更親和的函數(shù)式編程體驗(yàn)，原生支持Python3、NumPy等科學(xué)計(jì)算的接口加速，并能夠結(jié)合自動(dòng)微分能力和機(jī)制加速進(jìn)行編譯優(yōu)化，進(jìn)一步滿足創(chuàng)新訴求。

一個(gè)簡單易懂的道理：誰能幫助大模型開發(fā)者提高生產(chǎn)力，降低門檻和成本，誰就會(huì)成為他們口碑相傳的必備工具。

2020年昇思MindSpore的下載量還只有10萬次，2021年超過100萬次，到了大模型走向落地的2024年，下載量陡增到1100萬次，呈現(xiàn)出了一條鮮明的指數(shù)級(jí)增長曲線。隨著越來越多的能力升級(jí)，相信將有更多的開發(fā)者加入到昇思MindSpore開源社區(qū)。

04 寫在最后

AI框架是越用越好的生態(tài)，越多人使用意味著有更多的貢獻(xiàn)者、更多的問題與解決方案，繼而吸引到越多的開發(fā)者使用。

根據(jù)有關(guān)機(jī)構(gòu)的預(yù)測(cè)，未來三年大模型在生產(chǎn)經(jīng)營環(huán)節(jié)的應(yīng)用將同步提高到80%以上，一幅大模型驅(qū)動(dòng)的產(chǎn)業(yè)創(chuàng)新圖景已經(jīng)徐徐展開，一個(gè)由昇思MindSpore的開發(fā)者、伙伴及用戶創(chuàng)造的開源生態(tài)也將越來越繁榮。

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表數(shù)英立場(chǎng)。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注：作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。