開(kāi)源世界不是烏托邦,百度們正在創(chuàng)造新未來(lái)
1997年,著名黑客埃里克·斯蒂芬·雷蒙在《大教堂與市集》一書(shū)中預(yù)測(cè)了兩種不同的自由軟件開(kāi)發(fā)模式:
一種是大教堂模式,原始代碼是公開(kāi)的,但每個(gè)版本的開(kāi)發(fā)過(guò)程由一個(gè)專屬的團(tuán)隊(duì)管控;一種是市集模式,原始代碼同樣是公開(kāi)的,不過(guò)是放在互聯(lián)網(wǎng)上供人檢視及開(kāi)發(fā),最直接的例子就是Linux。
最終“市集模式”證明了開(kāi)源比閉源更加高效,全球99%的組織在IT系統(tǒng)中使用了大量的開(kāi)源代碼,開(kāi)源的價(jià)值也被越來(lái)越多的企業(yè)重視。比如微軟在2018年以75億美元的代價(jià)將代碼托管平臺(tái) GitHub 收入囊中,IBM則在2019年斥資340億美元收購(gòu)了著名開(kāi)源解決方案供應(yīng)商紅帽。
即便是開(kāi)源文化一度貧瘠的中國(guó)市場(chǎng),近幾年圍繞開(kāi)源項(xiàng)目的討論也逐漸熱鬧了起來(lái),BAT代表的科技巨頭們扛起了國(guó)內(nèi)開(kāi)源的大旗,陸續(xù)加入到開(kāi)源項(xiàng)目的建立和維護(hù)中,一次次釋放了涌動(dòng)的激情。
對(duì)于中國(guó)的開(kāi)源文化從哪里來(lái),又將要走向何處,百度這樣的開(kāi)源力量可以說(shuō)是不可錯(cuò)失的研究樣本。
01 聚焦AI的技術(shù)派
早在上世紀(jì)90年代末,開(kāi)源力量就在太平洋的彼岸澎湃。但彼時(shí)的中國(guó)幾乎絕緣于互聯(lián)網(wǎng)之外,就連計(jì)算機(jī)都還是少數(shù)派的玩物。
時(shí)間上的遲到削弱了中國(guó)在開(kāi)源世界中的存在感,缺少在硬件和底層技術(shù)上的話語(yǔ)權(quán),缺少自主的操作系統(tǒng)和軟件生態(tài),缺少通過(guò)開(kāi)源實(shí)現(xiàn)商業(yè)化的成功案例,導(dǎo)致中國(guó)開(kāi)發(fā)者在很長(zhǎng)一段時(shí)間內(nèi)扮演著學(xué)習(xí)者的角色。
人工智能浪潮的興起,為中國(guó)開(kāi)發(fā)者創(chuàng)造了追平前輩們的機(jī)會(huì),何況人工智能和開(kāi)源幾乎有著天然的關(guān)聯(lián)。
正如人工智能領(lǐng)域家喻戶曉的一個(gè)比喻:如果說(shuō)AI是一場(chǎng)饕餮盛宴,數(shù)據(jù)是原材料,算力是天然氣,算法是菜譜,開(kāi)源就如同無(wú)數(shù)廚師用經(jīng)驗(yàn)與智慧合著而成的烹飪百科全書(shū)。其他廚師可以從書(shū)中學(xué)習(xí)經(jīng)驗(yàn)制作菜肴,也可以指出書(shū)中存在的問(wèn)題,并源源不斷地為百科全書(shū)貢獻(xiàn)新的菜譜。
百度則進(jìn)一步證明了這樣一個(gè)道理:開(kāi)源不是論資排輩的武林江湖,而是屬于技術(shù)派的自由世界。
2013年百度率先開(kāi)源了可視化庫(kù)ECharts,提供了直觀、生動(dòng)、可交互、可個(gè)性化定制的數(shù)據(jù)可視化圖表,并由此開(kāi)始了百度的開(kāi)源之路。
2016年是百度開(kāi)源的破局之年,深度學(xué)習(xí)框架百度飛槳正式開(kāi)源,填補(bǔ)了國(guó)產(chǎn)深度學(xué)習(xí)框架的市場(chǎng)空白。
2017年百度開(kāi)源繼續(xù)兇猛發(fā)力,當(dāng)年發(fā)布了全球首個(gè)自動(dòng)駕駛開(kāi)源項(xiàng)目——Apollo 自動(dòng)駕駛開(kāi)放平臺(tái),加速了智能駕駛的行業(yè)進(jìn)程。
2018年百度內(nèi)部應(yīng)用了十年的 Doris正式擁抱開(kāi)源世界,孵化于百度鳳巢的交互式 SQL數(shù)據(jù)倉(cāng)庫(kù),至今仍是國(guó)內(nèi)唯一的分析型數(shù)據(jù)庫(kù)。
2019年百度開(kāi)源項(xiàng)目持續(xù)刷新,扛住了數(shù)次春晚紅包流量波峰的七層流量轉(zhuǎn)發(fā)平臺(tái)BFE對(duì)外開(kāi)源,并在2020年6月份被 CNCF接納為Sandbox Project。
截止到目前,百度已經(jīng)主導(dǎo)了上千個(gè)開(kāi)源項(xiàng)目,在GitHub上收獲了超過(guò)30萬(wàn)Star,社區(qū)貢獻(xiàn)者數(shù)量也已上萬(wàn)。不過(guò)作為AI領(lǐng)域的技術(shù)派,百度的存在感儼然不只是建立在開(kāi)源項(xiàng)目的數(shù)量上,同時(shí)還刷新了中國(guó)開(kāi)源項(xiàng)目的高度。
注:2020/2019年度全球開(kāi)源深度學(xué)習(xí)框架活躍度排名榜單
按照衡量深度學(xué)習(xí)框架活躍趨勢(shì)的權(quán)威性指標(biāo)pull request的數(shù)據(jù)顯示,百度飛槳PaddlePaddle均力壓谷歌TensorFlow,緊隨Facebook PyTorch之后,已經(jīng)成為了國(guó)內(nèi)第一、世界第二的深度學(xué)習(xí)開(kāi)源框架;Apache ECharts (incubating) 在 Github 中的 star 數(shù)已經(jīng)超過(guò) 41.4k,每周 npm 下載量超過(guò) 22 萬(wàn);Doris被廣泛應(yīng)用于美團(tuán)、小米、京東、華為、快手等頭部企業(yè)的項(xiàng)目中……
開(kāi)源創(chuàng)造了技術(shù)最大的公約數(shù),百度正成為這個(gè)時(shí)代的弄潮人。
02 社區(qū)中的建筑師
開(kāi)源的世界里流傳著這樣一句格言:社區(qū)重于代碼。
這句話的題中之意,恰恰道出了開(kāi)源世界的鐵律,開(kāi)源社區(qū)的聚合和放大效應(yīng)比開(kāi)源代碼更有價(jià)值。
正如開(kāi)源社聯(lián)合創(chuàng)始人劉天棟給出的觀點(diǎn):“開(kāi)源市場(chǎng)就像魔方,表面上看每個(gè)成員都是獨(dú)立的一面,但經(jīng)過(guò)排列、融合,會(huì)呈現(xiàn)出很多種組合可能?!边@也是不少人為開(kāi)源唱贊歌,并努力推動(dòng)中國(guó)開(kāi)源進(jìn)程的直接原因。
開(kāi)源的精神是自由的,可細(xì)究到開(kāi)源世界里的話語(yǔ)權(quán),起決定性作用的往往不是精神,而是精神背后的市場(chǎng)規(guī)律,以至于常常出現(xiàn)開(kāi)源社區(qū)被強(qiáng)權(quán)左右的現(xiàn)象。就連一向以“開(kāi)源”自居的GitHub,也屢屢傳出封禁伊朗、俄羅斯等國(guó)籍開(kāi)發(fā)者的消息,已然違背了開(kāi)源社區(qū)存在的初衷。
注:全球范圍內(nèi)開(kāi)源社區(qū)百花齊放
留給BAT們的挑戰(zhàn)在于,所要扮演的角色不只是“兩耳不聞身外事”的技術(shù)派,還要著實(shí)捍衛(wèi)中國(guó)開(kāi)發(fā)者的權(quán)益。
在開(kāi)源社區(qū)的運(yùn)作中,百度找到了兩個(gè)著力點(diǎn):
一是深度參與了國(guó)內(nèi)外頂級(jí)開(kāi)源基金會(huì)和組織,成為了 Apache 基金會(huì)、Linux 基金會(huì)以及云原生計(jì)算基金會(huì)的金牌會(huì)員,以及開(kāi)放原子基金會(huì)的理事單位。由于基金會(huì)擁有對(duì)開(kāi)源軟件的管理和所有權(quán),積極參與到基金會(huì)的運(yùn)作有利于維護(hù)社區(qū)的中立,比如避免中國(guó)的開(kāi)源項(xiàng)目被惡意孤立。
二是戰(zhàn)略投資中文開(kāi)源技術(shù)社區(qū)開(kāi)源中國(guó),后者運(yùn)營(yíng)的Gitee代碼托管平臺(tái)已經(jīng)是全球僅次于GitHub的代碼托管平臺(tái),每日約增加5000名開(kāi)發(fā)者、200家企業(yè)客戶、1.7萬(wàn)代碼倉(cāng)庫(kù),已經(jīng)具備了在國(guó)際市場(chǎng)上與GitHub全面抗衡的基礎(chǔ),也是中國(guó)開(kāi)源力量不可或缺的底牌所在。
注:Gitee代碼托管平臺(tái)
打一個(gè)比方的話,百度對(duì)開(kāi)源的認(rèn)識(shí)并沒(méi)有局限于貢獻(xiàn)了多少代碼,還在一磚一瓦砌出中國(guó)的開(kāi)源社區(qū)生態(tài)。
至于其中的原因,可以參考百度創(chuàng)始人李彥宏的觀點(diǎn):“開(kāi)源并不意味著所有東西都是免費(fèi)的,還需要是我們自主可控的,很多開(kāi)源的東西還是掌握在別人手里的,這個(gè)我們要有充分的認(rèn)識(shí)?!?/p>
無(wú)獨(dú)有偶,華為消費(fèi)者BG軟件部總裁王成錄也有著同樣的擔(dān)憂:“大家想一想,我們現(xiàn)在的軟件開(kāi)發(fā),開(kāi)源已經(jīng)是大家都無(wú)法再去把它忘掉的模式,那么這些開(kāi)源社區(qū)的代碼就是離不開(kāi)的資源。如果中國(guó)沒(méi)有自己的開(kāi)源社區(qū)去維護(hù)管理這些代碼,我們中國(guó)的所有軟件行業(yè)將是非常危險(xiǎn)的?!?/p>
社區(qū)是開(kāi)源協(xié)作精神與創(chuàng)新的搖籃,除了對(duì)技術(shù)的一腔豪情,還要勇于擔(dān)當(dāng)起秩序守衛(wèi)者的責(zé)任,畢竟現(xiàn)實(shí)世界不同于理想主義。
03 產(chǎn)業(yè)化的布道者
跳出開(kāi)源中立與否的語(yǔ)境,中國(guó)開(kāi)源的現(xiàn)實(shí)問(wèn)題在于產(chǎn)業(yè)化。
整個(gè)商業(yè)的重心已經(jīng)從To C轉(zhuǎn)向To B,新基建、智能經(jīng)濟(jì)的浪潮再度為這種趨勢(shì)摁下了“快進(jìn)鍵”,開(kāi)源平臺(tái)能否抓住產(chǎn)業(yè)智能化的窗口期,釋放出技術(shù)拓荒的生態(tài)紅利,將是打通戰(zhàn)略價(jià)值的關(guān)鍵一躍。
國(guó)內(nèi)開(kāi)源生態(tài)存在的短板也不無(wú)明顯,比如開(kāi)源軟件集中在數(shù)據(jù)庫(kù)、操作系統(tǒng)等應(yīng)用層,缺少深入產(chǎn)業(yè)細(xì)枝末節(jié)的生態(tài)協(xié)同,開(kāi)源技術(shù)的落地應(yīng)用還有很長(zhǎng)一段路要走。也就是說(shuō),中國(guó)的開(kāi)源生態(tài)還集中在產(chǎn)業(yè)鏈上游,中游和下游的環(huán)節(jié)仍然有些薄弱,需要花費(fèi)一定的時(shí)間補(bǔ)課。
不過(guò)這并非是唱衰中國(guó)開(kāi)源生態(tài)的借口。
一方面,中國(guó)有著全球最龐大的人口和市場(chǎng),將是最好的開(kāi)源項(xiàng)目孵化器。
特別是在新基建浪潮的驅(qū)動(dòng)下,將有越來(lái)越多的企業(yè)擁抱開(kāi)源項(xiàng)目。百度、華為等行業(yè)領(lǐng)頭羊們也開(kāi)始將開(kāi)源軟件從技術(shù)與商業(yè)上形成合圍,提供各個(gè)層次的技術(shù)賦能,比如在飛槳和百度大腦的基礎(chǔ)上,通過(guò)與百度智能云的融合打通,向外界輸出智能交通、智能家居、智慧金融等場(chǎng)景化的解決方案。
注:百度智能云服務(wù)架構(gòu)
另一方面,源代碼并不是開(kāi)源最重要的元素,而是人與人通過(guò)代碼的聯(lián)結(jié)。
百度代表的科技巨頭紛紛刮起了產(chǎn)學(xué)結(jié)合風(fēng),激勵(lì)國(guó)內(nèi)的大學(xué)生們參與到開(kāi)源社區(qū)的建設(shè)中來(lái),增強(qiáng)和激勵(lì)開(kāi)源精神的同時(shí),也在為行業(yè)持續(xù)輸送高端人才??梢哉业降睦佑泻芏啵珿itee上的高校數(shù)量已經(jīng)超過(guò)1000所、百度飛槳推出了針對(duì)高校的生態(tài)激勵(lì)計(jì)劃……開(kāi)源的產(chǎn)業(yè)化進(jìn)程正在以肉眼可見(jiàn)的速度推進(jìn)。
這個(gè)過(guò)程中,百度開(kāi)源迎來(lái)了自己的第三個(gè)角色,即產(chǎn)業(yè)化過(guò)程中的布道者。
小凱(化名)是一名本科在校生,卻在飛槳社區(qū)中被稱為“GT大佬”。除了有一副為別人答疑的熱心腸,小凱還參與了大自然保護(hù)協(xié)會(huì)的野生動(dòng)物圖片篩選和標(biāo)注項(xiàng)目,找來(lái)自己比賽時(shí)的小伙伴,利用飛槳的監(jiān)督學(xué)習(xí)算法完成了大批量數(shù)據(jù)標(biāo)注的驗(yàn)證和調(diào)優(yōu),預(yù)計(jì)將在年底將項(xiàng)目交付大自然保護(hù)協(xié)會(huì)。
小鵬(化名)是飛槳社群中的一員,在社區(qū)里認(rèn)識(shí)了很多有趣的朋友,并且嘗試借助飛槳搭建自己的深度學(xué)習(xí)模型。小鵬的想法是通過(guò)攝像頭捕捉和識(shí)別手語(yǔ),再將手語(yǔ)轉(zhuǎn)化成語(yǔ)音,從而實(shí)現(xiàn)和聾啞人交流的目標(biāo)。目前小鵬的模式已經(jīng)有了比較準(zhǔn)確的識(shí)別,并將項(xiàng)目代碼上傳到了社區(qū)開(kāi)源,希望可以幫助更多的人。
小凱和小鵬都是百度開(kāi)源社區(qū)中的一份子,或許他們的力量還有些稚弱,對(duì)社區(qū)的貢獻(xiàn)還非常有限。可當(dāng)00后的年輕一代都開(kāi)始活躍于開(kāi)源社區(qū)的時(shí)候,中國(guó)的開(kāi)源生態(tài)已經(jīng)燃起了持續(xù)壯大的星星之火。
04 寫(xiě)在最后
中國(guó)開(kāi)源的崛起和擴(kuò)張,似乎并沒(méi)有什么捷徑可走。
需要更多聚焦AI的技術(shù)派,持續(xù)貢獻(xiàn)優(yōu)質(zhì)的開(kāi)源項(xiàng)目,讓中國(guó)在開(kāi)源世界的站位逐步從邊緣移向舞臺(tái)中央;
需要更多社區(qū)中的建筑師,不斷增強(qiáng)中國(guó)在開(kāi)源社區(qū)中的話語(yǔ)權(quán),并一步一個(gè)腳印的打造中國(guó)的開(kāi)源社區(qū);
還需要更多立足于產(chǎn)業(yè)化的布道者,將開(kāi)源項(xiàng)目和產(chǎn)業(yè)需求深度融合,同時(shí)培養(yǎng)下一代年輕人的開(kāi)源信仰。
至少在這條看得見(jiàn)的路上,百度們正在堅(jiān)定向前。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_(kāi)頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無(wú)評(píng)論哦,快來(lái)評(píng)論一下吧!
全部評(píng)論(0條)