中國(guó)科技新基建再次領(lǐng)先 “科技新基建”宜早不宜遲

來(lái)源:中國(guó)網(wǎng)

日前,美媒《華爾街日?qǐng)?bào)》報(bào)道稱(chēng):美國(guó)羨慕中國(guó)的基礎(chǔ)設(shè)施,并希望加強(qiáng)基建以夯實(shí)美國(guó)經(jīng)濟(jì)增長(zhǎng)。事實(shí)上,對(duì)“基礎(chǔ)設(shè)施”的建設(shè),除了短期內(nèi)可拉動(dòng)增長(zhǎng)刺激就業(yè)外,更重要的意義是“有力地支持全領(lǐng)域共同繁榮”。“十四五”規(guī)劃中,“科技創(chuàng)新”成為焦點(diǎn),加強(qiáng)科技的基礎(chǔ)設(shè)施建設(shè),從而更高效、高質(zhì)量的實(shí)現(xiàn)全領(lǐng)域共同進(jìn)步。中國(guó)科技新基建再次當(dāng)先。

宜早不宜遲的“科技新基建”

人工智能是科技新基建的核心之一,而深度學(xué)習(xí)又是人工智能的先鋒。自 2012年深度學(xué)習(xí)取得突破進(jìn)展,眾多深度學(xué)習(xí)框架應(yīng)運(yùn)而生,成為研究者和業(yè)界工作者的新寵。不管深度學(xué)習(xí)研發(fā)進(jìn)行的多么火熱,都要轉(zhuǎn)化為生產(chǎn)力和商業(yè)價(jià)值,最終落地到產(chǎn)業(yè)中,而且宜早不宜遲。

實(shí)踐鑒差距。“做不做得出來(lái)”跟“用不用得起來(lái)”差的完全是“從0到1”的決定距離。從早期的學(xué)術(shù)框架 Caffe、Theano,到如今有業(yè)界背景的大規(guī)??蚣躊ytorch,TensorFlow以及國(guó)內(nèi)最早開(kāi)源的飛槳PaddlePaddle來(lái)看,AI新基建絕非一朝一夕可成,需要長(zhǎng)期持續(xù)的投入和產(chǎn)業(yè)實(shí)踐打磨,方可有所沉淀。

2016年,百度PaddlePaddle就打響了國(guó)產(chǎn)深度學(xué)習(xí)框架開(kāi)源的第一槍,成為我國(guó)首個(gè)自主研發(fā)的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)臺(tái)。2019年4月,在 Wave Summit深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)上,PaddlePaddle發(fā)布中文名“飛槳”,開(kāi)始強(qiáng)調(diào)自己更適合中國(guó)開(kāi)發(fā)者,以及更加專(zhuān)注于深度學(xué)習(xí)模型的產(chǎn)業(yè)實(shí)踐。2020年5月,飛槳作為百度大腦“AI大生產(chǎn)臺(tái)”的基礎(chǔ)底座,構(gòu)建“飛槳開(kāi)源深度學(xué)習(xí)臺(tái)”和“飛槳企業(yè)版”,更精準(zhǔn)地服務(wù)各類(lèi)AI模型開(kāi)發(fā)訓(xùn)練與部署。

其中,飛槳開(kāi)源深度學(xué)習(xí)臺(tái)已涵蓋核心框架、基礎(chǔ)模型庫(kù)、端到端開(kāi)發(fā)套件與工具組件,為產(chǎn)業(yè)、學(xué)術(shù)、科研創(chuàng)新提供基礎(chǔ)底座。飛槳企業(yè)版包括零門(mén)檻AI開(kāi)發(fā)臺(tái)EasyDL和全功能AI開(kāi)發(fā)臺(tái)BML,滿足企業(yè)快速智能化需求。飛槳全臺(tái)功能與開(kāi)發(fā)流程成熟完善,完全站在使用者角度定義技術(shù)迭代。今年3月,飛槳核心框架已正式升級(jí)為2.0版本。飛槳生態(tài)凝聚了超過(guò)265萬(wàn)開(kāi)發(fā)者,服務(wù) 10萬(wàn)多家企業(yè),創(chuàng)建超過(guò) 34萬(wàn)個(gè)模型。

權(quán)威數(shù)據(jù)調(diào)研機(jī)構(gòu)IDC公布了2020年下半年深度學(xué)習(xí)框架臺(tái)市場(chǎng)份額報(bào)告,數(shù)據(jù)顯示,Google、百度、Facebook穩(wěn)居前三,占據(jù)70%以上市場(chǎng)份額。其中,百度占比提升3.38%增速第一,綜合市場(chǎng)份額位列第二。

能+高效率=萬(wàn)物皆智能、一切可編程

人類(lèi)使用工具這事兒可以追溯到史前文明。工具的意義在于輔助勞動(dòng),省時(shí)省力,這也是飛槳作為工具存在的意義。能被廣泛開(kāi)發(fā)者用起來(lái)的工具也才是好工具。要知道,這個(gè)時(shí)代對(duì)于很多人來(lái)講,搶時(shí)間就是搶市場(chǎng)、搶優(yōu)勢(shì)、搶奪競(jìng)爭(zhēng)力。以飛槳最新發(fā)布的框架2.0正式版為例,更便利高效且通用的AI開(kāi)發(fā)與訓(xùn)練部署,正方便著各個(gè)領(lǐng)域中的企業(yè)用AI技術(shù)建立自己的智能化領(lǐng)先優(yōu)勢(shì)。

具體來(lái)看,首先此次升級(jí)后,飛槳框架2.0可支持用戶使用動(dòng)態(tài)圖完成深度學(xué)習(xí)相關(guān)領(lǐng)域全類(lèi)別的模型算法開(kāi)發(fā),這標(biāo)志著飛槳的動(dòng)態(tài)圖功能已經(jīng)成熟完備。不僅方便開(kāi)發(fā)者隨時(shí)查看變量輸入、輸出的動(dòng)態(tài)情況,更有助于調(diào)試程序便捷化,減少了憑手感與玄學(xué)的“盲調(diào)”。同時(shí),飛槳框架2.0還做到了模型存儲(chǔ)和加載的接口統(tǒng)一,保證“動(dòng)轉(zhuǎn)靜”之后保存的模型文件能夠被純動(dòng)態(tài)圖加載和使用。就像靜態(tài)圖像與動(dòng)態(tài)視頻一樣,可以一鍵“高畫(huà)質(zhì)”互相轉(zhuǎn)換,實(shí)際上是方便了使用端的操作。此外,官方支持的動(dòng)態(tài)圖算法數(shù)量達(dá)到了270+,涵蓋計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音、推薦等多個(gè)領(lǐng)域,并且在動(dòng)態(tài)圖的訓(xùn)練效率和部署效率方面都有所提升。

人工智能的價(jià)值,是通過(guò)軟件編程實(shí)現(xiàn)虛擬化、靈活、多樣和定制化功能,并最終向各個(gè)行業(yè)和人群提供專(zhuān)用的智能化、定制化服務(wù)。軟件與硬件在深度融合時(shí)的核心就是API。AI時(shí)代里,API之上一切皆可編程,而API之下,則要求“如無(wú)必要不增實(shí)體”,所以API絕對(duì)是技術(shù)對(duì)外輸出、以怎樣的方式實(shí)現(xiàn)可用的關(guān)鍵點(diǎn)。飛槳框架2.0也對(duì)自身 API體系進(jìn)行了全新升級(jí),包括體系化梳理和簡(jiǎn)潔化處理。簡(jiǎn)單來(lái)說(shuō),就是把AI技術(shù)對(duì)外的輸出“路徑”變得更加好用,更加兼容,方便技術(shù)的“一鍵輸出”。

在訓(xùn)練層面上,飛槳框架2.0在支持萬(wàn)億規(guī)模稀疏參數(shù)基礎(chǔ)上,也已實(shí)現(xiàn)支持千億規(guī)模稠密參數(shù)模型訓(xùn)練。作為“從實(shí)踐中來(lái),到實(shí)踐中去”的技術(shù),AI的可用與高效,必然都是從實(shí)踐中獲得的。分布式訓(xùn)練源自于百度自身的場(chǎng)景需求,可謂是飛槳與生俱來(lái)的特。此外,在飛槳框架2.0版本中,還新增支持了混合并行模式,即數(shù)據(jù)并行、模型并行、流水線并行這三種并行模式可以相互組合使用,可更高效地將模型的各網(wǎng)絡(luò)層甚至某一層的參數(shù)切分到多張 GPU卡上進(jìn)行訓(xùn)練,從而真正支持不同場(chǎng)景下的千億規(guī)模稠密參數(shù)模型訓(xùn)練。

“領(lǐng)先”直接轉(zhuǎn)化為“降本”

飛槳框架2.0推出業(yè)內(nèi)首個(gè)“通用異構(gòu)參數(shù)服務(wù)器”技術(shù),可使訓(xùn)練任務(wù)對(duì)硬件型號(hào)不敏感,即可以同時(shí)使用不同的硬件混合異構(gòu)訓(xùn)練。通過(guò)異構(gòu)參數(shù)服務(wù)器模式,用戶可以在異構(gòu)硬件集群中部署分布式訓(xùn)練任務(wù),目的是對(duì)不同算力的芯片高效利用,獲得更高吞吐,更低資源消耗的訓(xùn)練能力。異構(gòu)參數(shù)服務(wù)器擁有非常高的價(jià)比,如下圖所示,僅用兩個(gè)CPU機(jī)器加兩個(gè)GPU機(jī)器就可以達(dá)到與4個(gè)GPU機(jī)器相仿的訓(xùn)練速度,而成本至少可以節(jié)約35%。

飛槳還著力建起業(yè)界最為完備的硬件合作生態(tài)。作為一塊“智能革命”的磚,AI必須哪里有需要就往哪里搬。所以如何“搬過(guò)去”就很關(guān)鍵了。飛槳全面深度適配各種人工智能硬件,除了英特爾、英偉達(dá)、ARM等諸多芯片廠商,還有飛騰、海光、鯤鵬、龍芯、申威等 CPU,并結(jié)合麒麟、統(tǒng)信、普華操作系統(tǒng),以及百度昆侖、海光 DCU、寒武紀(jì)、比特大陸、瑞芯微、高通、英偉達(dá)等 AI芯片深度融合。此外,還和浪潮、中科曙光等服務(wù)器廠商合作形成軟硬一體的全棧AI基礎(chǔ)設(shè)施。當(dāng)前飛槳已經(jīng)適配和正在適配的芯片或 IP達(dá)到 29款。

現(xiàn)如今,AI的大規(guī)模落地已經(jīng)步入快車(chē)道,深度學(xué)習(xí)技術(shù)不斷發(fā)展,以飛槳為首的國(guó)產(chǎn)框架迎來(lái)時(shí)代機(jī)遇。2021年,基于飛槳的企業(yè)級(jí)開(kāi)發(fā)工具庫(kù)數(shù)量越來(lái)越多,內(nèi)容越來(lái)越豐富,加入飛槳生態(tài)社區(qū)的用戶越來(lái)越多,它正在成為加速這個(gè)時(shí)代走向智能化的重要驅(qū)動(dòng)力。可以說(shuō),飛槳“技術(shù)賦能萬(wàn)物”的磅礴力量正在顯現(xiàn)。(陳蕊)

標(biāo)簽: 科技 新基建

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)