首屆昇騰AI創(chuàng)新大賽,“照見”好學(xué)不倦的“后浪”
經(jīng)過半年多的激烈角逐后,首屆昇騰AI創(chuàng)新大賽正式收官。
作為面向AI開發(fā)者打造的頂級賽事,昇騰AI創(chuàng)新大賽分為兩個賽道:一個是面向行業(yè)場景進行應(yīng)用創(chuàng)新的應(yīng)用賽道,意在推動人工智能的產(chǎn)業(yè)落地;另一個是基于昇思進行算法、前沿任務(wù)創(chuàng)新的昇思賽道,瞄準了人工智能的前沿課題。
在產(chǎn)業(yè)智能化的浪潮下,和AI相關(guān)的賽事早已不勝枚舉,最大的意義莫過于吸引各行各業(yè)的開發(fā)者,并借助比賽來放大品牌影響力。1560個隊伍參與的首屆昇騰AI創(chuàng)新大賽,卻讓外界看到了另一種可能:AI創(chuàng)新大賽既是對前沿技術(shù)的創(chuàng)新、探索與實踐,也是一個不斷“掘金”的過程。
比如應(yīng)用賽道涌現(xiàn)出了不少優(yōu)秀的創(chuàng)業(yè)團隊,在區(qū)域市場被驗證的解決方案,有望在全國范圍內(nèi)推廣復(fù)制。昇思賽道則印證了另一種可能:沖在AI最前沿的不只有著作等身的學(xué)術(shù)大牛,還有很多好學(xué)不倦的“后浪”。
01 “浙大學(xué)霸”與社區(qū)資深布道師
昇騰AI創(chuàng)新大賽昇思賽道最終評選出的金獎選手中,有一個年輕的新面孔——正在浙江大學(xué)控制科學(xué)與工程學(xué)院讀研究生的項靖陽。
在許多人的認知里,“研一”階段屬于人生的“迷茫期”,白天按部就班地學(xué)習(xí)專業(yè)課程,然后在業(yè)余時間讀幾篇專業(yè)文獻,目的是熟悉自己的課題方向。至于論文、比賽什么的,還不在當前計劃的范圍內(nèi)。
項靖陽可以說是妥妥的“少數(shù)派”。
早在大二的時候,項靖陽就在學(xué)院老師的指導(dǎo)下進了實驗室,跟著研究生師兄師姐做一些科研課題、參加一些開發(fā)者賽事。那時候“人工智能”的概念如火如荼,項靖陽和很多年輕人一樣,對新事物有著無限興趣,并在實驗室?guī)熜值膸ьI(lǐng)下接觸到了剛剛宣布開源的昇思MindSpore,做了自己的第一個算法模型。
大二以后的日子里,項靖陽把大部分業(yè)余時間花在了科研上。其他同學(xué)忙于人際交往、娛樂消遣、實習(xí)工作時,項靖陽的生活卻是實驗室、宿舍與食堂間的“三點一線”。按照他的話說:“科研更像是表面枯燥乏味,但內(nèi)里的樂趣是無窮的。”其中的樂趣,似乎來自于項靖陽的自學(xué)能力,平時上課中有不理解的知識點,他會主動到B站和MOOC看學(xué)習(xí)視頻,比如專業(yè)課中考試難度很大的《自動控制原理》。
這種源自內(nèi)心深處的探索欲,讓項靖陽有了一個新身份——昇思MindSpore社區(qū)里的資深布道師。
按照昇思MindSpore社區(qū)的官方介紹,“資深布道師”的門檻相當嚴格,至少發(fā)布過5篇昇思MindSpore相關(guān)原創(chuàng)優(yōu)質(zhì)技術(shù)文章,且平均閱讀量不低于5000;至少在昇思MindSpore開源社區(qū)主導(dǎo)過1個特性級開發(fā);至少舉辦過1場或參加過3場線上/線下昇思MindSpore技術(shù)分享;同時需要是社區(qū)特邀的行業(yè)資深人士。
據(jù)項靖陽同學(xué)回憶:“剛接觸昇思MindSpore時還是一個AI新手,但在社區(qū)里遇到了很多師兄師姐,在他們的幫助下慢慢了解了AI框架。然后自己開始做模型和算子,在社區(qū)里回答別人的問題,有空的時候在知乎、CSDN等平臺上寫一些技術(shù)博客,一步一步成為了社區(qū)里的資深布道師。”
昇騰AI創(chuàng)新大賽的消息在昇思MindSpore社區(qū)公布后,項靖陽第一時間選擇報名參賽,讓他沒想到的是:報名的時候還是一位忙畢設(shè)的大四學(xué)生,利用暑假的空隙做了自己感興趣的三道賽題,等到昇騰AI創(chuàng)新大賽收官時,項靖陽已經(jīng)是浙江大學(xué)控制科學(xué)與工程學(xué)院的研一學(xué)生,找到了“深度學(xué)習(xí)模型壓縮”的研究方向。
02 超越論文精度,靠“硬實力”出圈
別人眼中的項靖陽,或許只是個“初出茅廬”的研一學(xué)生。可在昇思MindSpore社區(qū)里,項靖陽已然是一位精通深度學(xué)習(xí)模型“老鳥”。
似乎有必要重溫下昇思賽道的賽制:主辦方通過篩選熱門論文、前沿創(chuàng)新任務(wù)設(shè)置了30道賽題,主要來自CVPR、ICCV、ACL、ICML、NIPS等AI頂會過去幾年里的熱門模型,參數(shù)選手可以選擇一個或多個任務(wù),基于鵬城“云腦2”環(huán)境進行挑戰(zhàn),提交算法達到指定精度或要求即可視為完成。
“藝高人膽大”的項靖陽挑戰(zhàn)了三個任務(wù)。
第一個任務(wù)是“利用昇思MindSpore實現(xiàn)Swin Transformer V2圖像分類網(wǎng)絡(luò)”,來自于微軟亞洲研究院在CVPR發(fā)表的論文《Scaling Up Capacity and Resolution》。原作者將Swin Transformer縮放到30億個參數(shù),使其能夠使用高達1536×1536分辨率的圖像進行訓(xùn)練,提高了大視覺模型的穩(wěn)定性,降低了預(yù)訓(xùn)練和微調(diào)之間的分辨率差距,并讓常規(guī)GPU訓(xùn)練大型視覺模型成為可能。
第二個任務(wù)是“利用昇思MindSpore實現(xiàn)conformer圖像分類網(wǎng)絡(luò)”,源于國科大在ICCV上發(fā)表的優(yōu)秀論文,將Transformer和CNN進行融合并提出了全新的Conformer模型,可以在不顯著增加計算量的前提下顯著提升基網(wǎng)表征能力。
第三個任務(wù)是“利用昇思MindSpore實現(xiàn)Big Transfer圖像分類網(wǎng)絡(luò)”,Google于2020年在ECCV上發(fā)表的論文,作者重新審視了預(yù)訓(xùn)練+微調(diào)的范式,先在一個大規(guī)模標記數(shù)據(jù)集上進行預(yù)訓(xùn)練,然后對目標任務(wù)上的每個訓(xùn)練權(quán)重進行精調(diào)任務(wù),最終減少了目標任務(wù)所需的數(shù)據(jù)量和優(yōu)化時間。
項靖陽花了近一個月的時間對原論文進行學(xué)習(xí),理解原作者的提出的方法,對三道賽題間的共性進行分析,總結(jié)出了一套利用昇思MindSpore進行模型遷移、論文復(fù)現(xiàn)、精度與性能調(diào)優(yōu)的工作流程。
特別是在論文復(fù)現(xiàn)的過程中,項靖陽針對Ascend 910進行了混合精度配置、算子層面的模型性能調(diào)優(yōu)等工作,針對昇思MindSpore整圖設(shè)計的理念,花了很長時間對訓(xùn)練、推理的整體模板進行適配;遇到一些精度模型無法達標的情況,就參考其他論文和方法,并利用數(shù)據(jù)增強、正則化等方式進一步促進模型的訓(xùn)練和收斂流程。
最終Swin Transformer V2、Conformer和Big Transfer均入圍前三名,達到了超越原論文精度的效果。
正是對科研的激情和熱愛,項靖陽同學(xué)在內(nèi)的年輕人徹底 “征服”了現(xiàn)場的評委們。鵬城實驗室開源主管鄧清毫不吝嗇的評價道:“在昇思賽道與各個高校的同學(xué)的日常對接中,能感覺到這些選手是真正的熱衷于人工智能科研的莘莘學(xué)子,深切地感受到了他們的能力,也很欣慰有這么多優(yōu)秀的年輕學(xué)者開源開放的生態(tài)里努力、進步和學(xué)習(xí)。”
03 “學(xué)練訓(xùn)賽”的人才培養(yǎng)新路徑
像項靖陽這樣優(yōu)秀的年輕人,在昇思MindSpore社區(qū)中還有很多,他們從“小白”到“高手”的成長曲線,無疑比賽事本身更值得探討。
正如高盛在《全球人工智能產(chǎn)業(yè)布局》中的預(yù)測,2030年時中國的人工智能人才缺口將超過500萬人。想要在不到10年時間里填補500萬的人才缺口,強化本科教育和產(chǎn)學(xué)研聯(lián)合人才培養(yǎng),業(yè)已成為社會上下的共識。
昇騰AI創(chuàng)新大賽的另一初衷恰在于此。
簡單回顧項靖陽同學(xué)的成長經(jīng)歷,可以清晰地劃分為四個階段:第一個階段是學(xué),在學(xué)校學(xué)習(xí)編程及AI相關(guān)的基礎(chǔ)知識;第二個階段是練,不管是跟著師兄做科研,還是在昇思MindSpore社區(qū)中做模型,都是練的過程;第三個階段是訓(xùn),譬如在昇思MindSpore社區(qū)中主導(dǎo)的特性級開發(fā);第四個階段是賽,典型的案例就是昇騰AI創(chuàng)新大賽,為項靖陽在內(nèi)的同學(xué)提供了學(xué)為所用的舞臺。
傳統(tǒng)的產(chǎn)學(xué)研培養(yǎng)方案,往往集中在學(xué)和練兩個環(huán)節(jié),昇思MindSpore社區(qū)和昇騰參與的一系列賽事,打通了學(xué)、練、訓(xùn)、賽四個環(huán)節(jié),跑出了AI人才培養(yǎng)新路徑。尤為值得一提的是,昇騰AI創(chuàng)新大賽昇思賽道將近幾年的優(yōu)秀論文和前沿課題作為賽題,其實隱藏著“以賽促研”的初衷。
想要“復(fù)現(xiàn)論文”,首先要做的就是對論文的“精讀”,理解原作者提出的方法,可能涉及數(shù)據(jù)預(yù)處理技術(shù)、神經(jīng)網(wǎng)絡(luò)架構(gòu)、訓(xùn)練技巧和處理等內(nèi)容;在實驗的過程中,通常包含有關(guān)數(shù)據(jù)集、訓(xùn)練和評估的詳細信息、模型在各種參數(shù)下的表現(xiàn),甚至需要與其他論文中的最新方法進行比較,將論文中的參考文獻通讀一遍……
如果是時間比較久遠的“經(jīng)典論文”,或許可以找到不少教程,復(fù)制粘貼過來就可能跑通。近幾年的新論文,意味著可以找到的參考資料并不多,想要將論文復(fù)現(xiàn),既要讀懂、吃透論文中的精髓,還要有強大的學(xué)習(xí)能力、自驅(qū)力和工程能力,這也是想要自己發(fā)表論文時的必備技能。
就像項靖陽同學(xué)的例子,參賽時選擇的三個賽題都和圖像分類相關(guān),和他選擇的研究方向有很大關(guān)系。目前項靖陽正在準備自己的論文,昇騰AI創(chuàng)新大賽的參賽經(jīng)歷,雖然只花了一個半月的時間,但與計算機視覺領(lǐng)域的前沿研究進行了一場“深度溝通”,進一步夯實了他的科研之路。
再來思考昇騰AI創(chuàng)新大賽的價值,所籌謀的遠不止打造一場頂級賽事,還在幫助開發(fā)者推開一扇新的大門:通過學(xué)、練、訓(xùn)、賽一體化的賽制,吸引越來越多像靖陽這樣的“后浪”接觸AI、認識AI、擁抱AI,不斷為中國的AI人才培養(yǎng)孕育“火種”。
04 寫在最后
產(chǎn)業(yè)智能化浪潮的演進,需要源源不斷的人才輸入。
在這樣的共識下,正有越來越的科技企業(yè)參與到AI人才培養(yǎng)中,產(chǎn)學(xué)研的人才機制越發(fā)完善與成熟。同時需要思考的是,人才的能力和視野,直接決定著智能化轉(zhuǎn)型的深度和高度,左右著中國在全球智能化競賽中的競爭力,為莘莘學(xué)子們提供一條走在最前沿的成長路徑,不可謂不重要。
昇騰AI創(chuàng)新大賽獨立設(shè)置昇思賽道,儼然洞察到了時代的新趨勢,而“后浪”們的崛起已然印證了昇騰的前瞻性。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)