亞馬遜云科技多位AI大咖現身,都談了些什么?
文:鄒大斌
來源:云數科技圈
2022世界人工智能大會(WAIC)于日前落幕。
經過過去四屆的發展與沉淀,今天的世界人工智能大會已成為人工智能領域最有影響力的國際盛會之一,今年大咖云集、國際大廠扎堆,充分彰顯了大會的國際影響力和磁力效應。亞馬遜云科技受邀參加了2022世界人工智能大會,并主辦了“人工智能前沿技術趨勢與最佳實踐”的線上分論壇。
論壇上,亞馬遜云科技人工智能與機器學習產品副總裁Bratin Saha博士、亞馬遜云科技上海人工智能研究院院長、資深首席科學家張崢教授、亞馬遜云科技人工智能開源項目首席產品經理、開源AutoML框架AutoGluon的開發負責人葉文銘、亞馬遜云科技機器學習加速芯片Inferentia和 Trainium 的首席架構師 Ron Diamant等人工智能領域科學家、產品專家、高級學者分享了亞馬遜云科技在人工智能與機器學習領域的探索過程以及該領域最新前沿趨勢與行業洞見。
01 機器學習重塑數據洞察
人工智能是當下增長最快的市場之一。IDC報告顯示,到2023年人工智能系統支出將達到979億美元,與2019年相比增加了2.5倍。在人工智能眾多分支領域中,機器學習是研究和應用最為活躍的領域之一。根據Gartner的研究分析,到2024年,75%的企業將把機器學習技術真正用于生產,為業務所賦能。背后的原因在于,機器學習解決了對非結構化數據的分析問題,重塑了對數據的洞察。
在人工智能和機器學習的推廣應用上,亞馬遜云科技是積極的實踐者并一直走在前沿,從亞馬遜智能語音助手Alexa、無人便利店Amazon Go到亞馬遜電商網站都有機器學習的身影。從2016年開始,亞馬遜云科技決定將機器學習的專業能力對外輸出,為客戶提供各種人工智能和機器學習服務。
如今使用亞馬遜云科技的人工智能和機器學習功能服務的客戶超過10萬,覆蓋金融、汽車、醫療、工業制造等眾多行業,其中包括眾多行業頭部客戶,如Capital One、飛利浦、湯遜路透、NFL、F1賽車、西門子和拜耳等,它們利用亞馬遜云科技的機器學習能力取得了重要的業務成果。
大量客戶應用亞馬遜云科技的人工智能和機器學習服務,進一步加速了該業務的成長,使其成為亞馬遜云科技有史以來增長最快的服務之一。
“在服務客戶的過程中我們學到了很多寶貴的經驗。其中之一就是,機器學習不再是我們需要規劃的未來,而是我們現在就需要駕馭的當下。”亞馬遜云科技人工智能與機器學習產品副總裁 Bratin Saha博士在其主題演講中表示。
02 豐富的工業化工具集為AI賦能
在亞馬遜云科技一直在推動機器學習普及工作,為此推出了豐富的機器學習工具集,以賦能具有不同AI/ML機器學習需求的開發者和使用者。這些工具集可以分為三層:
基礎層是為機器學習專家提供的經過優化的深度學習框架。如Tensorflow、MXNet,方便專家們快速地構建環境,避免框架兼容性和依賴性等問題,從而提升訓練速度、降低推理延遲。
值得一提的是,除了對現有深度學習框架進行優化外,亞馬遜云科技還做了大量創新的探索工作,比如紐約大學、亞馬遜云科技上海研究院等共同開發的面向圖神經網絡以及圖機器學習的開源框架Deep Graph Library(DGL)和亞馬遜云科技研發并開源的AutoGluon代碼庫。
會上亞馬遜云科技上海人工智能研究院院長、資深首席科學家張崢教授就DGL最新進展進行了分享。張崢教授透露,目前DGL 0.9已經推出,年內將發布DGL 1.0版。亞馬遜云科技人工智能開源項目首席產品經理、開源AutoML框架AutoGluon開發負責人葉文銘分享并演示 了AutoGluon 如何在 5 分鐘內通過 3 行代碼徹底改變機器學習工作流程,助力開發者輕松構建超大規模的機器學習應用。
位于中間的是Amazon SageMaker。這是一個端到端的機器學習平臺,它覆蓋機器學習應用的全流程,從數據標記、數據處理、特征存儲、算法探索、模型推理到上線再到邊緣端設備管理等為開發人員提供全過程支持。
最上一層是各種開箱即用的機器學習和人工智能服務。它們讓客戶無需機器學習的經驗,就能快速地把這些能力集成到他們自己的應用或者業務流程中,如人臉識別、聊天機器人,以及個性化推薦、企業級搜索、欺詐檢測等。
值得一提的是,與很多技術供應商不同,亞馬遜云科技在推動人工智能和機器學習落地的過程中,非常重視機器學習的工業化,致力于實現智能化技術的普惠。
“機器學習要從極少數的專用應用程序,演變到在我們的生活中無處不在,就要通過自動化、工具化,通過部署和標準化的流程,即通過軟件的工業化來實現的。”Bratin Saha說。
03 強大的算力為AI提供強力支持
人工智能應用大多數是算力密集型應用,非常依賴強大的算力支持,特別是一些參數高達數十億個的大模型訓練,對于算力的需求尤為突出。為了推動人工智能、機器學習的普及,亞馬遜云科技一直致力于為機器學習量身定制的基礎設施,讓客戶能獲得最佳性能,并且以最低成本來大規模部署機器學習應用。
一方面,亞馬遜云科技充分利用業界最新的研究成果,能為客戶提供基于英偉達、英特爾、AMD、賽靈思等新一代的GPU和加速器的實例,并持續不斷地優化成本。比如,G5實例相比基于G4dn為推理提供3倍的性能增強;EC2 P4d實例與上一代P3和P3dn實例相比,可以降低高達60%的訓練成本,且訓練深度學習模型的性能提高2倍。
另一方面,亞馬遜云科技通過自主設計的AI專用芯片進一步降低機器學習的算力成本。Inferentia是亞馬遜云科技推出的首款AI定制芯片,面向推理場景。和基于GPU的實例相比,基于Inferentia的實例可提供多達2倍的吞吐量,每次推理的成本降低了70%。Trainium是另一款機器學習芯片,面向訓練場景,基于Trainium的實例也能提供比GPU更高的性價比。
“訓練模型的計算需求正以類似的速度增長,但傳統服務器計算能力的增長并沒有這么快。兩者的差距正在增大,差距的擴大意味著機器學習變得越來越復雜和昂貴。”亞馬遜云科技機器學習加速芯片Inferentia和 Trainium 的首席架構師 Ron Diamant在演講時表示。
他說,亞馬遜云科技研發Inferentia和Trainium的目的就是要為客戶提供快速、易用使用、可擴展和負擔得起的機器學習加速實例。
04 讓更多的人使用機器學習
讓更多人能夠構建機器學習解決方案,也是機器學習普及的關鍵驅動因素。根據Linkedin關于新興職業的調查,在過去4年里,對人工智能和機器學習專家的招聘需求增了74%,是其他新興職業增長率的2倍。然而,機器學習仍處于早期,企業很難找到合適的人才。
除了提供專業的工具外,還有什么辦法能幫到這個行業,讓更多人能使用機器學習術?亞馬遜云科技想到了一個解決方案,這就是Amazon SageMaker Canvas。Amazon SageMaker Canvas是一個低代碼開發平臺,它讓業務分析人員、營銷和銷售分析師,以及其他對機器學習并不熟悉、不會編碼的人也能從機器學習模型中獲得洞察。
當然,僅有Amazon SageMaker Canvas還不夠,學生也是亞馬遜云科技重點關注對象。為了讓學生也可以學習機器學習,亞馬遜云科技推出了Amazon SageMaker Studio Lab。它是一個無需設置和付費的機器學習開發環境,甚至不需要有亞馬遜云科技的賬戶,只要有一個郵箱就可以開始使用。它不僅提供免費計算,還提供免費的存儲空間。
亞馬遜云科技還承諾到2025年,幫助世界各地的2900萬人培養技術技能,為之提供免費的云計算技能培訓,機器學習教育也是其中之一。
另外,截至目前已有來自150多個國家、超過14萬的開發者在亞馬遜云科技的DeepRacer項目接受過機器學習的培訓。這是一輛比例為1:18的全自動賽車,由機器學習技術驅動。亞馬遜云科技還提供免費的教育課程,這些課程原本是為亞馬遜內部的機器學習大學準備的。比如,亞馬遜云科技編纂了《動手學機器學習》這門課程已經被多所大學采用,如斯坦福大學、清華大學、新加坡國立大學、劍橋大學等,在GitHub上也開源了這門課程。
結束語
今天,成為數據驅動的企業成為不少企業的目標。根據Forrester的研究,數據驅動企業每年平均保持30%的增長率,同時,仍有68%的組織認為他們沒有從數據中獲得實實在在的價值,原因是沒有現代數據戰略。而這正是亞馬遜云科技的用武之地。
實際上,幫助企業成就其現代數據戰略,真正實現數據的業務價值,才是亞馬遜云科技的真正布局,而人工智能和機器學習只是整體布局下的一環。它與亞馬遜云科技的數據庫、數據倉庫、大數據平臺等共同構成了亞馬遜云科技的現代數據戰略。
應該說,經過多年的努力,亞馬遜云科技圍繞數據已經構建起非常完整的工具棧,并一直持續迭代創新,為企業利用數據創新提供最大程度地支持。現在,工具已經備齊,如何用好它們就看企業自己的了!
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)