依據IDC發(fā)布的《中國智算服務市場(2023下半年)跟蹤》報告,我國智算服務市場的增量幾乎全部來自GenAI IaaS和智算集成服務。其中,GenAI IaaS市場由火山引擎、阿里巴巴和商湯科技等引領,智算集成服務市場則是華為一家獨大,呈現出與公有云和IT集成服務截然不同的市場格局,但又遵循著與云服務類似的發(fā)展規(guī)律。
我國智算服務市場格局
據IDC統(tǒng)計,2023年下半年,我國智算服務1市場整體規(guī)模達到114.1億元,同比增長85.8%。其中,GenAI IaaS市場呈0到1式增長,規(guī)模達到32.2億元,為整體智算服務貢獻了59%的增量;Non-GenAI IaaS市場緩慢增長至45.9億元,僅貢獻3%的增量;智算集成服務2受各地政府大力推進智算中心建設等因素驅動,市場規(guī)模達到36.0億元,同比增長129.4%,貢獻了38%的增量。
競爭格局方面,火山引擎、商湯科技和華為的表現引人注目。
GenAI IaaS市場:火山引擎、阿里巴巴、商湯科技、百度和騰訊占據前五位,份額合計約70%,市場集中度與公有云IaaS相近。其中,火山引擎和商湯科技這兩家并不屬于公有云第一梯隊的廠商,份額分別達到21%和15%,這意味著生成式AI或將催生新的云巨頭。
智算集成服務市場:華為、新華三、百度、寒武紀和中國電子云占據前五位,份額合計約55%,市場集中度遠高于IT咨詢與集成服務以及定制化開發(fā)服務等市場(CR5僅為15%~20%)。其中,華為獨占超過45%的份額,成為絕對霸主;百度、寒武紀、中國電子云等主營業(yè)務各異的非傳統(tǒng)系統(tǒng)集成服務廠商,也分別取得了2%上下的份額。這或許說明與傳統(tǒng)IT服務相比,智算集成服務更加要求供應商在資源和服務等方面擁有差異化優(yōu)勢。
TOP廠商的核心競爭力
1.火山引擎:背靠字節(jié)跳動,火山終于“爆發(fā)”
作為字節(jié)跳動旗下的云廠商,火山引擎依托豐沛智算資源、領先萬卡集群和開放模型平臺等在2023年實現高速擴張,同比增速超過150%,并正通過進一步激發(fā)應用生態(tài)為增長飛輪注入更多動能。
豐沛智算資源:在人工智能被打上“落地變緩”“負增長”等這些標簽的2022年,火山引擎為滿足抖音等字節(jié)跳動自有業(yè)務,以及自動駕駛和生物信息計算等新興領域頭部客戶的需求,持續(xù)囤積智算資源,順理成章地在生成式AI爆發(fā)且算力供不應求的情況下,成為了智譜AI、月之暗面、Minimax、零一萬物和百川智能等一眾AI初創(chuàng)公司的算力底座。
萬卡集群技術:隨模型參數量從千億邁向萬億,以及推理需求不斷增長,大模型的算力要求升級,高效率且高穩(wěn)定的萬卡集群成為新一輪智算基礎設施競賽的必選項。字節(jié)跳動聯(lián)合北京大學發(fā)表論文3,針對在萬卡集群上訓練大模型的效率和穩(wěn)定性問題提出MegaScale生產系統(tǒng)。論文顯示,在12288塊GPU上訓練1750億參數大語言模型時,MegaScale實現了55.2%的算力利用率(MFU),是英偉達Megatron-LM的1.34倍。
開放模型平臺:與阿里云、百度智能云等先卷大模型不同,火山引擎首先將匯聚和開放第三方大模型作為重點,推出火山方舟MaaS平臺。通過搭建模型需求端和供給側間的橋梁,火山引擎在幫助模型廠商拓展客戶的同時也實現了自身收入增長。
激發(fā)應用生態(tài):隨AI大模型的普及度和滲透率不斷提升,推理工作負載將遠大于訓練工作負載;鹕揭婵礈蔬@一趨勢,將字節(jié)跳動豆包大模型的推理輸入價格降至0.8厘/千tokens,以期降低客戶試錯成本,繁榮AI應用生態(tài)。
2.商湯科技:大裝置發(fā)揮大作用
商湯科技2014年以視覺AI起家,2018年開始打造由模型層、深度學習平臺和計算基礎設施等三部分構成的AI基礎設施——SenseCore商湯AI大裝置。依托大裝置,商湯科技不僅對外提供豐富的AI云產品和行業(yè)解決方案,也實現了自有“日日新”大模型體系的高速迭代。在“大裝置+大模型”驅動下,商湯科技2023年生成式AI收入突破11.8億元,同比增長近200%。
前瞻性布局智算中心:商湯科技2020年起陸續(xù)在上海、深圳、廣州、福州、濟南和重慶等多地建設智算中心,截至2023年底,上線GPU數量達到45000張,總運營算力達到12 EFLOPS。其中,上海臨港智算中心于2020年啟動建設,2022年正式運營,24年4月算力規(guī)模達到8.1 EFLOPS,位居我國乃至全球前列。
打造高效穩(wěn)定萬卡集群:商湯科技已實現萬卡互聯(lián),集群線性加速比超過90%,同時保證超30天穩(wěn)定訓練不間斷和訓練間斷半小時恢復。
高性價比推理服務:商湯科技2023年將推理服務性價比提升300%,大幅降低大模型推理單位成本。
3.華為:領先芯片和全棧服務顯身手
領先AI芯片:在美不斷升級對華半導體出口管制和我國信創(chuàng)進程加速的背景下,華為昇騰910B作為少數可與英偉達A100等海外高端GPU抗衡的國產AI芯片之一,是華為得以拿下眾多智算中心建設項目的殺手锏。
全棧智算服務:基于30余年的ICT服務經驗,華為已形成從規(guī)劃、集成、運維到模型使能和人才培養(yǎng)等的端到端智算集成服務,幫助客戶建好和用好智算基礎設施。
運營商競爭策略
回顧云服務發(fā)展歷程,1.0階段,亞馬遜和阿里巴巴等互聯(lián)網大廠將自有資源和技術向其他互聯(lián)網企業(yè)開放,順利打開市場;2.0階段,中國電信等運營商抓住政企上云機遇,憑借不斷提升的技術實力和長年累積的服務經驗實現規(guī)模擴張。
如今,智算服務1.0因“百模大戰(zhàn)”開啟,火山引擎和商湯科技等對智算資源和技術早有儲備的企業(yè)占得市場先機。面對將由行業(yè)大模型帶動的智算服務2.0,運營商已從資源、技術、產品和服務等多方面做好準備,如中國電信規(guī)劃并建設覆蓋全國的“2+3+7+X”公共智算云池,打造國產萬卡智算集群,加快構建“息壤”一體化智算服務體系和能力等。
然而,由于其他智算服務提供商,如AI企業(yè)、互聯(lián)網/云廠商和其他央國企等,多同樣具備政企服務經驗,因此運營商在智算服務2.0將面臨比云服務2.0更為嚴峻的競爭環(huán)境。建議:
一是強化安全可信,針對在AI時代被進一步放大的數據(含算法、代碼等)隱私與安全問題,依托機密計算4等技術,打造可在AI全生命周期內保障數據和模型等的機密性與完整性的智算基礎設施,讓客戶安心使用AI IaaS;
二是繁榮模型生態(tài),秉持開放共贏理念,幫助自研和第三方模型、MaaS平臺與AI應用等觸達客戶;
三是升級集成服務,理解與把握政企客戶對智算基礎設施的當下和長遠需求,提供從建到用再到后續(xù)升級的高水平全棧服務。
注釋:
1.IDC將智算服務定義為以GPU、FPGA、ASIC等AI專用算力為主的基礎設施服務,主要包括智算集成服務和智算基礎設施即服務(AI IaaS)。其中,AI IaaS市場又分為面向生成式AI的GenAI IaaS和面向渲染、仿真、視聯(lián)網推理等非生成式AI的Non-GenAI IaaS等兩個細分市場。
2.智算集成服務指廠商在幫助客戶建設私有智算基礎設施過程中提供的咨詢、集成、開發(fā)、運維等專業(yè)和管理服務。
3.《MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs》。
4.機密計算是一種通過在基于硬件的可信執(zhí)行環(huán)境(TEE)中執(zhí)行計算來保護使用中的數據的技術。
本文作者
魏玥
戰(zhàn)略發(fā)展研究所
副主任分析師
碩士,高級工程師,長期從事ICT產業(yè)研究,近年來專注云計算、人工智能、產業(yè)數字化等領域。