雷鋒網(wǎng)按,本文分析了目前AI芯片市場(chǎng)的情況,以及NVIDIA在這一市場(chǎng)的領(lǐng)先地位。不過(guò),隨著芯片巨頭在AI芯片領(lǐng)域有了新的進(jìn)展,NVIDIA將會(huì)面臨更多的挑戰(zhàn),2019年AI芯片市場(chǎng)會(huì)如何?
作者將會(huì)分三部分進(jìn)行介紹,本文是第一部分。
NVIDIA的領(lǐng)先優(yōu)勢(shì)
過(guò)去的五年,NVIDIA在數(shù)據(jù)中心領(lǐng)域成為了規(guī)模數(shù)十億美元的巨頭,并且沒(méi)有一次面對(duì)持續(xù)且非常強(qiáng)勁的對(duì)手,這是一個(gè)令人驚訝的事實(shí)。NVIDIA快速增長(zhǎng)的動(dòng)力來(lái)自人工智能(AI)和高性能計(jì)算(HPC)對(duì)GPU芯片的需求。NVIDIA首席執(zhí)行官Jensen Huang喜歡談?wù)撋疃葘W(xué)習(xí)的“寒武紀(jì)爆炸”,指的是神經(jīng)網(wǎng)絡(luò)算法的快速迭代。
目前,我們處于AI芯片爆發(fā)的門口,全球許多大型和小型公司都加入其中。三年前,芯片創(chuàng)業(yè)公司幾乎不可能獲得風(fēng)險(xiǎn)投資,現(xiàn)在,有數(shù)十家資金充足的挑戰(zhàn)者在研發(fā)AI芯片。
去年,NVIDIA和 IBM為世界上最快的超級(jí)計(jì)算機(jī)提供芯片(據(jù)稱其中95%的性能歸功于NVIDIA的Volta GPU)。雖然這是一項(xiàng)令人難以置信的成就,但許多人開(kāi)始懷疑NVIDIA的輝煌能否持續(xù)。
在最新報(bào)告季度,NVIDIA數(shù)據(jù)中心收入同比增長(zhǎng)58%至7.92億美元,占公司總收入的近25%。過(guò)去的四個(gè)季度總營(yíng)收達(dá)到28.6億美元。如果能夠保持這種增長(zhǎng)趨勢(shì),2019年數(shù)據(jù)中心營(yíng)收或達(dá)到約45億美元。
毫無(wú)疑問(wèn),NVIDIA以其強(qiáng)大的可擴(kuò)展架構(gòu)為動(dòng)力打造出受歡迎的產(chǎn)品。NVIDIA現(xiàn)在擁有一個(gè)強(qiáng)大且持續(xù)更新的軟件,高校、初創(chuàng)公司和合作伙伴使其成為由其新創(chuàng)建的生態(tài)的主導(dǎo)者。有些人會(huì)認(rèn)為這個(gè)生態(tài)系統(tǒng)是堅(jiān)固的護(hù)城河,但暴風(fēng)云正在出現(xiàn)。潛在的威脅來(lái)自英特爾,谷歌,AMD以及數(shù)十家美國(guó)和中國(guó)的初創(chuàng)公司。
目前為止,在我看來(lái),大部分競(jìng)爭(zhēng)者都“火力不足”。因?yàn)槲曳浅S行判某斯雀,其它挑?zhàn)者都沒(méi)有搶奪了NVIDIA的市場(chǎng)份額。讓我們來(lái)看看目前的競(jìng)爭(zhēng)格局,2019年將會(huì)變得非常有趣。
重磅的競(jìng)爭(zhēng)者
根據(jù)紐約時(shí)報(bào)的統(tǒng)計(jì),有超過(guò)40家創(chuàng)業(yè)公司進(jìn)入AI芯片領(lǐng)域,但實(shí)際情況是,只有少數(shù)公司能在這個(gè)市場(chǎng)上取得真正的成功(比如收入超過(guò)10億美元)。對(duì)于深度神經(jīng)網(wǎng)絡(luò)(DNN)的訓(xùn)練,鑒于其產(chǎn)品的實(shí)力,市場(chǎng)占有率和生態(tài)系統(tǒng),NVIDIA難以被擊敗。然而,目前市場(chǎng)規(guī)模還小的推理芯片市場(chǎng)最終將超過(guò)訓(xùn)練市場(chǎng)。
與訓(xùn)練不同,推理不是單一的市場(chǎng)。推理包含了云端和終端,每一種應(yīng)用對(duì)深度學(xué)習(xí)算法、性能、功耗和延遲都有特定的要求。另外,在推理市場(chǎng)還沒(méi)有絕對(duì)的領(lǐng)導(dǎo)者,即便NVIDIA聲稱在汽車市場(chǎng)擁有領(lǐng)導(dǎo)地位。
出于這些原因,推斷市場(chǎng)是大多數(shù)新進(jìn)入者主要或最初關(guān)注的方向。讓我們來(lái)看看重磅的競(jìng)爭(zhēng)者。
谷歌
谷歌是最早推出專用芯片(ASIC)的公司之一,然而谷歌可能是NVIDIA最大的客戶之一。谷歌的“Tensor Processing Units”(TPU)芯片已經(jīng)更新至第三代,可以加速云端的深度學(xué)習(xí)訓(xùn)練,最近還可以加速推理處理。據(jù)悉,用于訓(xùn)練和處理DNN的Google TPU的性能相當(dāng)穩(wěn)定,單芯片每秒性能可達(dá)45 TOPS。相比之下,NVIDIA的Volta性能最高可達(dá)125 TOPS。第一批TPU只供內(nèi)部使用,現(xiàn)在谷歌將它們作為服務(wù)提供給Google Compute Cloud的客戶。
雖然TPU會(huì)對(duì)谷歌的人工智能的發(fā)展產(chǎn)生影響,但除了內(nèi)部的,對(duì)外的服務(wù)(這是一個(gè)相當(dāng)大的市場(chǎng))是故意限制的。TPU只能用于培訓(xùn)和運(yùn)行Google TensorFlow框架,無(wú)法使用它來(lái)訓(xùn)練或運(yùn)行使用Apache MxNet或PyTorch構(gòu)建的AI,PyTorch框架的重要推動(dòng)者是Facebook 和微軟。TPU也不能用于非AI HPC應(yīng)用,這一領(lǐng)域GPU占據(jù)絕對(duì)主導(dǎo)地位。
此外,TPU也不向企業(yè)或政府的數(shù)據(jù)中心出售。但谷歌對(duì)此表示滿意,因?yàn)樗鼘PU和TensorFlow視為其全面的AI領(lǐng)導(dǎo)力戰(zhàn)略。針對(duì)硬件的軟件優(yōu)化,可以構(gòu)建強(qiáng)大而耐用的平臺(tái)。
TPU更直接的影響可能是驗(yàn)證ASIC可以作為GPU的替代品,至少對(duì)潛在投資者而言如此。深度學(xué)習(xí)芯片初創(chuàng)公司的首席執(zhí)行官表示,一旦谷歌宣布其TPU,風(fēng)險(xiǎn)資本就開(kāi)始尋找投資目標(biāo),他隨后獲得了數(shù)億美元投資。
谷歌一直擅長(zhǎng)從NVIDIA的GPU技術(shù)大會(huì)(通常在三月份)的可預(yù)測(cè)信息中竊取一些引人注意的信息,如果今年谷歌發(fā)布性能強(qiáng)大的7nm TPU,對(duì)比我不會(huì)感到驚訝。
亞馬遜也在去年秋天宣布,正在為推理處理研發(fā)ASIC。但是,該芯片仍在開(kāi)發(fā)中。
英特爾
英特爾是非常重磅的玩家,雖然該公司打算使用Nervana芯片在2019年參與人工智能訓(xùn)練和推理的競(jìng)爭(zhēng),但它意識(shí)到推理將是更大的市場(chǎng),并且擁有非常強(qiáng)大的實(shí)力。
除了Xeon CPU(最近更新后,推理性能得到顯著提升),該公司還分別收購(gòu)了MobileEye和Movidius,用于汽車和嵌入式推理。我已經(jīng)看過(guò)這兩種設(shè)備的演示,它們的確令人印象深刻。英特爾還推出了OpenVino軟件工具包,它允許開(kāi)發(fā)人員在任何地方進(jìn)行訓(xùn)練,然后在英特爾處理器上進(jìn)行優(yōu)化和運(yùn)行。
CES 2019上,英特爾透露正在與Facebook密切合作準(zhǔn)備推出Nervana神經(jīng)網(wǎng)絡(luò)處理器(NNP-I),因?yàn)樵S多人猜測(cè)Facebook正在開(kāi)發(fā)自己AI加速器。與此同時(shí),英特爾副總裁兼AI產(chǎn)品總經(jīng)理Naveen Rao在 Twitter上分享,NNP-I是采用英特爾10nm的SoC,并采用IceLake x86內(nèi)核。
對(duì)于訓(xùn)練,英特爾最初的計(jì)劃在收購(gòu)Nervana一年的2017年宣布“Lake Crest”Nervana NNP。之后推遲到2018年,然后,公司決定重新開(kāi)始。這可能是因?yàn)橛⑻貭栆庾R(shí)到第一款Nervana設(shè)備不足以大幅超越NVIDIA。
高通和蘋(píng)果
為了完整性,我將高通和蘋(píng)果也包括在內(nèi),因?yàn)樗鼈兌继峁┝肆钊擞∠笊羁痰氖謾C(jī)人工智能功能(高通也布局IoT和自動(dòng)駕駛汽車)。蘋(píng)果專注于iPhone A系列CPU和用于手機(jī)AI的iOS操作系統(tǒng)支持。隨著移動(dòng)平臺(tái)成為語(yǔ)音和圖像AI推理的主要平臺(tái),這兩個(gè)玩家擁有大量可用于建立領(lǐng)導(dǎo)力的IP(盡管華為我們也非常努力地推動(dòng)人工智能。)
AMD
過(guò)去三年,AMD一直在努力讓AI的軟件正常運(yùn)轉(zhuǎn)。當(dāng)我2015年在那里工作時(shí),如果沒(méi)有啟動(dòng)Windows,你甚至無(wú)法在Linux服務(wù)器上運(yùn)行GPU。從那時(shí)起,AMD進(jìn)行了很多工作,ROCm軟件和編譯器簡(jiǎn)化了CUDA的遷移,并且在其芯片上加速數(shù)學(xué)庫(kù)MlOpen(不要與OpenML混淆)。然而,目前AMD的GPU仍然至少落后NVIDIA V100產(chǎn)品一代,而V100推出已經(jīng)接近兩年了。
AMD是否有能力在7nm上與NVIDIA TensorCores競(jìng)爭(zhēng),還有待觀察。AMD可能會(huì)決定更多地關(guān)注推理市場(chǎng),可能推出自動(dòng)駕駛汽車平臺(tái),類似NVIDIA Xavier SoC,時(shí)間會(huì)證明。
賽靈思
Xilinx 的FPGA在2018年表現(xiàn)出色,除了宣布其7nm的下一代架構(gòu)外,還與微軟、百度 、亞馬遜、阿里巴巴、戴姆勒-奔馳等合作伙伴達(dá)成合作。在AI推理中,F(xiàn)PGA具有優(yōu)于ASIC的優(yōu)勢(shì),因?yàn)镕PGA可以針對(duì)特定的應(yīng)用進(jìn)行即時(shí)重新配置。當(dāng)基礎(chǔ)技術(shù)快速變化時(shí),這很重要,就像AI一樣。
例如,微軟展示了其FPGA(來(lái)自賽靈思和英特爾)如何在深度神經(jīng)網(wǎng)絡(luò)中對(duì)特定層,可以使用1bit,3bit或其它精度的數(shù)據(jù)。這可以大大加快處理速度,并減少延遲,同時(shí)降低功率。此外,即將推出的Xilinx 7nm芯片稱為Versal,具有AI和DSP引擎,可加速特定應(yīng)用程序處理以及自適應(yīng)邏輯陣列。Versal將在今年的某個(gè)時(shí)候開(kāi)出貨,我認(rèn)為這可能是推理處理的改變者。