8月19日,在2023中國算力大會“算力網(wǎng)絡創(chuàng)新合作大會”分論壇上,由中國移動牽頭,攜手合作伙伴重磅發(fā)布“中移智庫”成果《中國移動NICC新型智算中心技術體系白皮書》。中國移動副總工程師、首席科學家王曉云出席發(fā)布儀式。
新型智算中心是以高性能GPU、AI加速卡等集群算力為核心,集約化建設的E級超大規(guī)模新型算力基礎設施,提供軟硬件AI全棧環(huán)境,支撐大模型的高效訓練和推理,賦能全行業(yè)數(shù)智化轉型升級。隨著模型參數(shù)規(guī)模從千億邁向萬億,互聯(lián)、算效、存儲、平臺、節(jié)能等五大技術領域將進行系統(tǒng)性重構,推動新型智算中心由集群時期走向超級池化時期。
在新互聯(lián)方面,為實現(xiàn)大規(guī)?ㄩg高速通信,產(chǎn)業(yè)應聯(lián)合打造統(tǒng)一的計算總線協(xié)議,推動國內高速互聯(lián)技術生態(tài)成熟;對于更大規(guī)模的網(wǎng)絡互聯(lián),中國移動創(chuàng)新性提出全調度以太網(wǎng)技術(GSE),革新以太網(wǎng)底層轉發(fā)機制,實現(xiàn)三大核心機制轉變,打造無阻塞、高帶寬、低時延、自動化的新型智算中心網(wǎng)絡。
在新存儲方面,為突破GPU顯存容量的限制,簡化AI模型開發(fā),應加速內存池技術的成熟,使得CPU、GPU/AI加速卡等異構設備共享統(tǒng)一內存,為大模型海量數(shù)據(jù)的高效處理奠定基礎。
在新算效方面,GPU作為主力芯片不斷提升算力能力,并基于存算一體重構計算范式,此外,為滿足海量數(shù)據(jù)處理帶來的極致性能要求,加強CPU,GPU、DPU三大芯片協(xié)同,整體提升智算云服務能力。
在新平臺方面,中國移動原創(chuàng)提出算力原生技術,打造“芯合”算力原生跨架構平臺,目標打破“框架+工具鏈+硬件”緊耦合的智算生態(tài),屏蔽底層硬件差異,實現(xiàn)智算應用的跨架構遷移部署。
在新節(jié)能方面,針對智算中心不斷攀升的能耗需求,中國移動將堅定推進液冷技術成熟,通過制定五大統(tǒng)一標準,實現(xiàn)極致能效、極高密度、極簡運維的三“極”目標。
中國移動將體系化推進智算成熟,在制定開放統(tǒng)一的技術標準的基礎上,打造智算科學裝置,開展科研類技術驗證;積極發(fā)揮鏈長作用,依托協(xié)同創(chuàng)新基地,聚合產(chǎn)業(yè)生態(tài);結合算力網(wǎng)絡試驗網(wǎng)CFITI,打造新型智算樣板間,加快我國智算產(chǎn)業(yè)跨越式發(fā)展。中國移動愿與產(chǎn)業(yè)合作伙伴一道,共同打造新型算力創(chuàng)新高地。