《開(kāi)放加速規(guī)范AI服務(wù)器設(shè)計(jì)指南》發(fā)布

來(lái)源:經(jīng)濟(jì)日?qǐng)?bào)客戶端

在日前舉辦的OCP ChinaDay大會(huì)上,業(yè)界首個(gè)面向AIGC(生成式人工智能)的《開(kāi)放加速規(guī)范AI服務(wù)器設(shè)計(jì)指南》(以下簡(jiǎn)稱指南)正式發(fā)布。

浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥介紹,該指南面向AIGC實(shí)際應(yīng)用場(chǎng)景,細(xì)化完善了開(kāi)放加速規(guī)范AI服務(wù)器的設(shè)計(jì)理論和方法,明確了硬件設(shè)計(jì)參考、管理接口規(guī)范和性能測(cè)試標(biāo)準(zhǔn)等,將為新興的AI芯片創(chuàng)新提供有力的系統(tǒng)平臺(tái)支撐,幫助AI芯片企業(yè)縮短研發(fā)和系統(tǒng)適配周期,大大減少開(kāi)發(fā)費(fèi)用,更快釋放算力價(jià)值,有效加速多元算力產(chǎn)業(yè)發(fā)展,助力AIGC時(shí)代的AI計(jì)算產(chǎn)業(yè)跨越“創(chuàng)新”鴻溝。


(資料圖片僅供參考)

加速開(kāi)放計(jì)算產(chǎn)業(yè)發(fā)展,系統(tǒng)級(jí)產(chǎn)品創(chuàng)新是關(guān)鍵。在基礎(chǔ)硬件、基礎(chǔ)軟件、核心應(yīng)用、上層生態(tài)間建立起統(tǒng)一的技術(shù)路線及標(biāo)準(zhǔn)API接口,將加速器模塊標(biāo)準(zhǔn)化,簡(jiǎn)化人工智能基礎(chǔ)架構(gòu)設(shè)計(jì),能夠有效縮短硬件開(kāi)發(fā)和產(chǎn)業(yè)賦能周期。

當(dāng)前,以大模型為代表的AIGC熱潮帶來(lái)了AI算力需求的爆發(fā)式增長(zhǎng)。更豐富的算力資源成為人工智能競(jìng)爭(zhēng)的核心基石。可以說(shuō),計(jì)算力就是生產(chǎn)力,智算力就是創(chuàng)新力。IDC預(yù)計(jì),全球 AI計(jì)算市場(chǎng)規(guī)模將從2022年的195億美元增長(zhǎng)到2026年的346.6億美 元,其中生成式AI計(jì)算市場(chǎng)規(guī)模將從 2022年的8.2億美元增長(zhǎng)到2026年的 109.9億美元。生成式AI計(jì)算占整體 AI計(jì)算市場(chǎng)的比例將從4.2%增長(zhǎng)到 31.7%。

AIGC技術(shù)創(chuàng)新是一項(xiàng)復(fù)雜的系統(tǒng)工程,需要基于海量數(shù)據(jù)集,在擁有成百上千加速卡的AI服務(wù)器集群上對(duì)千億級(jí)參數(shù)的AI大模型進(jìn)行分布式訓(xùn)練,這對(duì)算力資源的規(guī)模提出了極高的要求,也對(duì)算力系統(tǒng)設(shè)計(jì)帶來(lái)了新的挑戰(zhàn),要求單機(jī)具有更高的擴(kuò)展性、集群具有更高的加速比,由此對(duì)卡間互聯(lián)、網(wǎng)絡(luò)帶寬和延遲提出了更高的要求。

隨著AI大模型、超大模型的不斷發(fā)展,芯片公司相繼推出了新形態(tài)的AI加速卡來(lái)支持更高的功耗和更強(qiáng)大的卡間互聯(lián)能力。當(dāng)前,隨著數(shù)據(jù)中心用戶對(duì)AI計(jì)算力需求的不斷攀升,全球已有上百家公司投入新型AI芯片的研發(fā)與設(shè)計(jì),人工智能芯片發(fā)展呈現(xiàn)多元化趨勢(shì)。但各廠商采用不同技術(shù)路線,導(dǎo)致產(chǎn)業(yè)面臨硬件體系孤島和生態(tài)割裂問(wèn)題,帶來(lái)算力產(chǎn)業(yè)發(fā)展高成本和低靈活性的問(wèn)題。

“統(tǒng)一開(kāi)放的產(chǎn)業(yè)標(biāo)準(zhǔn)能有效降低技術(shù)獲取成本,推動(dòng)創(chuàng)新技術(shù)普及,為產(chǎn)業(yè)發(fā)展賦能提速?!崩顺毙畔I&HPC產(chǎn)品線高級(jí)產(chǎn)品經(jīng)理張政說(shuō)。

據(jù)了解,以O(shè)CP為代表的開(kāi)放計(jì)算項(xiàng)目,推出全新的、全球化的產(chǎn)業(yè)協(xié)作模式,通過(guò)消除技術(shù)壁壘,加快計(jì)算產(chǎn)業(yè)創(chuàng)新的速度。其中,OCP的OAI(開(kāi)放加速器基礎(chǔ)設(shè)施)開(kāi)放標(biāo)準(zhǔn)極大地激發(fā)了AI計(jì)算基礎(chǔ)設(shè)施集成的創(chuàng)新。目前,已有包括浪潮信息、Intel、燧原科技等10+系統(tǒng)和芯片廠商,通過(guò)開(kāi)放、合作為市場(chǎng)推出10余款符合OAM標(biāo)準(zhǔn)的開(kāi)放加速AI服務(wù)器,并在全球范圍內(nèi)開(kāi)展成功實(shí)踐,充分論證了技術(shù)可行性,構(gòu)建起茁壯的生態(tài)體系。

張政介紹,早在2019年OCP剛成立OAI小組時(shí),浪潮信息作為主導(dǎo)的核心成員之一,牽頭組織制定了UBB、OAM(云原生應(yīng)用)等規(guī)范,此后又發(fā)布了業(yè)界首個(gè)開(kāi)放加速參考系統(tǒng)MX1。浪潮信息還協(xié)同合作伙伴,共同完成了早期OAM的技術(shù)驗(yàn)證和積累,并發(fā)布了首款OAM服務(wù)器,將開(kāi)放加速真正快速投入到產(chǎn)業(yè)應(yīng)用中。在產(chǎn)業(yè)化落地的過(guò)程中,浪潮信息積累了很多經(jīng)驗(yàn),并總結(jié)轉(zhuǎn)化從而形成《開(kāi)放加速規(guī)范AI服務(wù)器設(shè)計(jì)指南》,以加速培育產(chǎn)業(yè)生態(tài)。

“事實(shí)上,我們也是國(guó)內(nèi)最早做AI加速卡間高速互連技術(shù)的企業(yè),對(duì)于如何構(gòu)建大規(guī)模的訓(xùn)練系統(tǒng)、如何加速AI模型訓(xùn)練,我們有豐富的經(jīng)驗(yàn)。浪潮信息AI服務(wù)器在市場(chǎng)規(guī)模和技術(shù)方面都有著領(lǐng)先的優(yōu)勢(shì)?!壁w帥說(shuō)。

據(jù)了解,開(kāi)放加速計(jì)算的硬件架構(gòu)正是為超大規(guī)模深度神經(jīng)網(wǎng)絡(luò)模型并行計(jì)算而生,天然適用于AIGC大模型訓(xùn)練。然而,當(dāng)前開(kāi)放計(jì)算技術(shù)推向產(chǎn)業(yè)落地的過(guò)程中,依然存在大量的定制化工作以及現(xiàn)有OAI標(biāo)準(zhǔn)未能完全覆蓋的領(lǐng)域。因此,浪潮信息基于豐富的開(kāi)放加速計(jì)算工程實(shí)踐和產(chǎn)品歷程,發(fā)布面向AIGC的指南,提出四大設(shè)計(jì)原則、全棧設(shè)計(jì)方法,旨在幫助社區(qū)成員更快更好地開(kāi)發(fā)符合開(kāi)放加速規(guī)范的AI加速卡,并大幅縮短與AI服務(wù)器的適配周期,為用戶提供最佳匹配應(yīng)用場(chǎng)景的AI算力產(chǎn)品方案。

其中,四大設(shè)計(jì)原則為應(yīng)用導(dǎo)向原則、多元開(kāi)放原則、綠色高效原則和統(tǒng)籌設(shè)計(jì)原則?;谏鲜鲈O(shè)計(jì)原則,以提高適配部署效率、提高系統(tǒng)穩(wěn)定性、提高系統(tǒng)可用性為目標(biāo),《指南》進(jìn)一步歸納總結(jié)出開(kāi)放加速規(guī)范AI服務(wù)器的設(shè)計(jì)方法,即多維協(xié)同設(shè)計(jì)、全面系統(tǒng)測(cè)試、性能測(cè)評(píng)調(diào)優(yōu)。

業(yè)內(nèi)人士認(rèn)為,開(kāi)放加速規(guī)范的AI服務(wù)器可為AI芯片創(chuàng)新提供成熟的系統(tǒng)平臺(tái)支撐,幫助AI芯片廠商聚焦于芯片創(chuàng)新研發(fā),實(shí)現(xiàn)更科學(xué)合理的產(chǎn)業(yè)分工,避免封閉技術(shù)生態(tài)存在的單點(diǎn)單線風(fēng)險(xiǎn),推動(dòng)智算產(chǎn)業(yè)生態(tài)健康發(fā)展;另一方面,基于開(kāi)放加速工程實(shí)踐和成熟計(jì)算平臺(tái)總結(jié)的設(shè)計(jì)指南,可加速有競(jìng)爭(zhēng)力的AI芯片的創(chuàng)新研發(fā)和落地部署,有效節(jié)省研發(fā)投入并縮短開(kāi)發(fā)適配周期50%以上,為用戶提供可以用來(lái)支撐AIGC大模型訓(xùn)練的多元算力解決方案,以多元算力之道破解當(dāng)下AI算力供需難題。(經(jīng)濟(jì)日?qǐng)?bào)記者 黃鑫)

標(biāo)簽:

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)