在寧夏賀蘭山東麓的葡萄園里,智能化管理系統(tǒng)對空氣溫度、風(fēng)速、土壤濕度等實(shí)時監(jiān)控,為葡萄酒釀制提供科學(xué)依據(jù);在山東能源李樓煤礦井下,攝像頭和傳感器背后的AI大模型替代工人充當(dāng)“監(jiān)工”,對鉆孔施工作業(yè)規(guī)范程度進(jìn)行自動判別……在越來越多的行業(yè)中,智能計(jì)算已經(jīng)成為破解發(fā)展問題的新思路。
記者從8月19日在寧夏銀川召開的2023中國算力大會上獲悉,近五年我國算力總規(guī)模年均增速近30%,目前已達(dá)到197EFLOPS,其中智能算力規(guī)模占比達(dá)25%,同比增加60%。智能算力將成為未來算力增長的主要動力。工業(yè)和信息化部黨組書記、部長金壯龍?jiān)跁现赋觯哟蟾咝阅苤撬愎┙o,增強(qiáng)算力網(wǎng)絡(luò)可靠性,提升高效集約利用水平。
大模型催生算力供給“新模式”
數(shù)據(jù)顯示,2023年上半年,與大模型直接相關(guān)的融資事件超20起,國內(nèi)已發(fā)布的各類大模型數(shù)量超過100個。記者從大會上獲悉,截至今年6月底,我國算力規(guī)模達(dá)到197EFLOPS,其中通用算力規(guī)模占比達(dá)74%,智能算力規(guī)模占比達(dá)25%,智能算力規(guī)模同比增加60%。
與會專家共識認(rèn)為,大模型的發(fā)展正在驅(qū)動我國算力結(jié)構(gòu)發(fā)生根本性變化?!敖鼛啄?,自動駕駛、生命醫(yī)學(xué)、智能制造等行業(yè)發(fā)展迅速,隨之而來的超大規(guī)模人工智能模型和海量數(shù)據(jù)對算力的要求不斷提高,適合大模型訓(xùn)練的智能算力成為算力增長的主要動力?!比A為公司董事長梁華表示。
產(chǎn)業(yè)鏈多方正進(jìn)一步加大高性能智算供給,激發(fā)AI算力賦能效應(yīng)。
中國商飛基于華為昇騰AI底座,面向大型科技設(shè)計(jì)打造了東方御風(fēng)大模型,對飛機(jī)機(jī)翼流場進(jìn)行模擬仿真,滿足工業(yè)級精度要求,仿真耗時僅為傳統(tǒng)軟件的1/24,助力于在7種領(lǐng)域加速飛機(jī)制造的創(chuàng)新?!叭A為構(gòu)建了對開發(fā)者友好的AI軟件開發(fā)平臺和生態(tài),讓各種各樣的大模型在昇騰的算力底座上加速創(chuàng)新,加速釋放高性能算力?!绷喝A說道。
與此同時,新的智能算力供給模式也在悉數(shù)涌現(xiàn)。
在大會期間,中國移動攜手多個智算中心、超算中心及云服務(wù)商,共同打造算力類型最全、規(guī)模最大、覆蓋最廣的“百川”算力并網(wǎng)平臺。“通過算力并網(wǎng),能夠形成一種新的算力供給模式,吸納包括大型算力中心、智算、超算的算力,甚至社會上一些閑散算力都能夠并入移動算力網(wǎng),像電力網(wǎng)一樣,風(fēng)電、水電都并到網(wǎng)里,讓用戶即取即得。”中國移動通信集團(tuán)首席科學(xué)家、副總工程師王曉云對《中國電子報(bào)》記者表示。
圖為2023中國算力大會中國移動展臺智算展區(qū)
“假如有一個渲染公司,擁有自己的智算,白天很忙,到晚上算力閑下來了,這個時候把算力并到移動的算力網(wǎng)上去,給該公司提供鏈接到用戶的服務(wù),使它的算力能讓全國任何一個地方的用戶都觸手可得?!蓖鯐栽婆e例說。
為幫助企業(yè)在初期投入最小的情況下,滿足自己大模型的使用,中國電信提供了“移動算力服務(wù)”。據(jù)中國電信首席大模型專家劉敬謙介紹,如果客戶想做微調(diào),想做二次訓(xùn)練,自己建立一個智算中心是非常不合算的,大模型訓(xùn)練有波動的特點(diǎn),運(yùn)營商買那么多卡天天閑置也是極大的資源浪費(fèi)。而“移動算力車”能夠把算力、算法、電源都綁定在一起,把車開到數(shù)據(jù)中心里面,幫助企業(yè)做微調(diào)服務(wù)。
“算、存、運(yùn)”需高效協(xié)同
數(shù)據(jù)顯示,算力、存力、運(yùn)力如果做好高效協(xié)同,一個AI算力中心的效率可能會提升50%。目前,許多發(fā)達(dá)國家已經(jīng)把算、存、運(yùn)三者涉及的科學(xué)技術(shù)作為創(chuàng)新前沿,并投入重金發(fā)展。
“中國算力總規(guī)模全球第二,但存在利用率不高等問題,甚至通用算力利用率只有百分之十幾?!贝髸陂g,中國工程院院士、紫金山實(shí)驗(yàn)室主任劉韻潔在接受《中國電子報(bào)》記者采訪時表示,“而像智算算力這樣的算力資源,又是稀缺的?!?/p>
為什么會出現(xiàn)這樣的矛盾?在劉韻潔看來,是運(yùn)力不足。以超算為例,目前運(yùn)輸存儲超算數(shù)據(jù)的硬盤還是通過卡車、火車、飛機(jī),算完了再把結(jié)果取回來,這些算力還都是孤島?!眲㈨崫嵳f,對于超算來說,如果通過現(xiàn)在的互聯(lián)網(wǎng)來運(yùn)輸數(shù)據(jù),雖然成本低,但是效率也很低,還不安全;如果通過專線,價(jià)格很貴,成本很高。這就需要有一個新的技術(shù)解決方案——公用專網(wǎng)的技術(shù),它不同于公網(wǎng)和專網(wǎng),而是一種類似于能提供專網(wǎng)的公網(wǎng),像專網(wǎng)一樣安全、保證質(zhì)量,又像公網(wǎng)一樣經(jīng)濟(jì)、方便靈活。
有數(shù)據(jù)顯示,從存力和算力的比重來看,美國是1.1,我國是0.4。“與美國相比,我國更注重算力,而存力不夠?qū)⒂绊懹?jì)算中心的效率?!敝袊こ淘涸菏磕吖饽险f。
全球已逐漸從以“機(jī)械技術(shù)”為主升級到以“半導(dǎo)體技術(shù)”為主。倪光南表示,當(dāng)前中國仍在大量使用機(jī)械存儲,落后于國際先進(jìn)水平。目前,全球3家主流機(jī)械硬盤企業(yè)都來自國外,未來用先進(jìn)存儲替代機(jī)械存儲,中國必須加快步伐。從性價(jià)比來講,已經(jīng)到了轉(zhuǎn)折點(diǎn),我們能夠大規(guī)模實(shí)現(xiàn)存儲技術(shù)變革。
面對層出不窮的應(yīng)用場景,產(chǎn)業(yè)界也推出了多種多樣的算力基礎(chǔ)設(shè)施,有傳統(tǒng)通用處理器,也有專用處理器、專用加速器等。而多種芯片和不同算力會形成很多延存,算力基礎(chǔ)設(shè)施也出現(xiàn)了“有的地方熱、有的地方冷”的情況。異構(gòu)算力、不同芯片間如何協(xié)同,進(jìn)而實(shí)現(xiàn)算力的高效供給?
在浪潮信息的張東看來,應(yīng)該面向各種應(yīng)用,以系統(tǒng)為中心,設(shè)計(jì)適合各種應(yīng)用、軟硬件一體化的系統(tǒng),即用一套系統(tǒng)、一朵云去管理這些芯片。但核心就在于一定要實(shí)現(xiàn)分層解耦,即每一層只負(fù)責(zé)這一層的工作,層和層之間還要開放標(biāo)準(zhǔn)。
尋求算力和能效的“有效平衡”
走進(jìn)2023中國算力大會的展廳,中科曙光一項(xiàng)“黑科技”吸引了不少人駐足。只見一塊塊服務(wù)器主板浸泡在橫向透明的液體箱子里,隨著服務(wù)器開啟工作,周圍的液體不斷地“咕嘟”冒泡,頗有“水煮主板”的感覺。
在算力規(guī)??焖僭鲩L的趨勢下,算力能耗總量也在急劇攀升。在降低數(shù)據(jù)中心PUE方面,液冷是成為目前業(yè)界公認(rèn)的最佳路徑,中科曙光展臺的工作人員告訴記者,相比傳統(tǒng)風(fēng)冷散熱,該款浸沒式液冷解決方案可使數(shù)據(jù)中心能耗降低30%,讓算力更加綠色化。
大會期間,記者在中興通訊展臺看到了液冷技術(shù)的另一種技術(shù)路線——冷板式液冷。酷似傳統(tǒng)風(fēng)冷機(jī)柜的背后,其實(shí)暗藏玄機(jī):依靠流經(jīng)冷板的液體,將固定在冷板上的元器件熱量帶走。據(jù)展臺工作人員介紹,冷板式液冷對數(shù)據(jù)中心服務(wù)器的改造成本較低,可以在成本和效能之間找到一個比較好的平衡點(diǎn)。
圖為中興通訊冷板式液冷機(jī)柜
解決能效問題,軟件也是關(guān)鍵環(huán)節(jié)。
“目前,數(shù)據(jù)中心電能僅有6%~12%真正用于計(jì)算本身。”螞蟻集團(tuán)副總裁、平臺技術(shù)事業(yè)群總裁何征宇指出,這些算力供給出來本質(zhì)上都是要被軟件所消費(fèi)的,沒有人可以直接用算力,它一定是通過軟件變成一個服務(wù)。那這個服務(wù)背后消耗的算力,就要看軟件的質(zhì)量如何,或者是軟件與硬件的協(xié)同程度怎么樣。
在軟硬件協(xié)同方面,已有不少企業(yè)展開探索,并從中獲益。超聚變數(shù)字技術(shù)有限公司從服務(wù)器部件能效動態(tài)尋優(yōu)、整機(jī)級能效動態(tài)尋優(yōu)以及數(shù)據(jù)中心能效動態(tài)尋優(yōu)技術(shù)三個維度,可以實(shí)現(xiàn)部件根據(jù)負(fù)載狀態(tài)動態(tài)調(diào)整自身參數(shù),達(dá)到自身能效最優(yōu);整機(jī)級無須重啟即可實(shí)現(xiàn)能效管理參數(shù)動態(tài)調(diào)整并生效;服務(wù)器系統(tǒng)網(wǎng)管,實(shí)現(xiàn)數(shù)據(jù)中心制冷與業(yè)務(wù)聯(lián)動,達(dá)到數(shù)據(jù)中心能效最優(yōu)。
據(jù)何征宇介紹,得益于軟件側(cè)和硬件側(cè)共同發(fā)力,去年螞蟻集團(tuán)的資源效率已經(jīng)提升至33%,而這一數(shù)據(jù)在三四年前還不足10%。隨著智能算力的高效供給,螞蟻集團(tuán)智能算力的利用效率已經(jīng)從17%提升到22%。
- QQ:61149512