2018年以來(lái),不少以算法為主的語(yǔ)音、視覺(jué)、自動(dòng)駕駛等公司也開(kāi)始研發(fā)AI芯片,將算法和芯片進(jìn)行更好的結(jié)合,來(lái)針對(duì)多樣化的場(chǎng)景,未來(lái)軟硬結(jié)合將會(huì)是趨勢(shì)。
隨著深度學(xué)習(xí)和AI應(yīng)用的不斷演進(jìn),近兩年AI芯片廠商不斷涌現(xiàn),加之貿(mào)易摩擦中芯片概念的普及,2018年的AI芯片領(lǐng)域持續(xù)火熱。在國(guó)內(nèi),貼上AI芯片標(biāo)簽的公司已經(jīng)超過(guò)40家,其中的佼佼者們獲得不菲融資。
盡管目前AI在行業(yè)應(yīng)用方面的滲透有限,但是算力的供需還是不平衡。近日,華為智能計(jì)算業(yè)務(wù)部總裁邱隆就向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:“原來(lái)由摩爾定律驅(qū)動(dòng)的計(jì)算產(chǎn)業(yè),面對(duì)爆發(fā)式的計(jì)算需求無(wú)以為繼。摩爾定律在正常的時(shí)候,以每年1.5倍增長(zhǎng),50%的算力增長(zhǎng),在過(guò)去幾年間,每年的算力實(shí)際增長(zhǎng)只有10%。人工智能在過(guò)去幾年間,算力增長(zhǎng)了30萬(wàn)倍,至少每一年我們的算力要增長(zhǎng)10倍!
這意味著人工智能除了算法外,對(duì)算力也存在強(qiáng)大的需求。面對(duì)增多的B端應(yīng)用場(chǎng)景,也有更多的AI芯片公司加入角逐。從功能角度細(xì)分,AI芯片可分為訓(xùn)練芯片和推理芯片,在訓(xùn)練方面,目前英偉達(dá)獨(dú)樹(shù)一幟,但是在推理方面,可選擇的芯片種類不只是GPU,還有FPGA(現(xiàn)場(chǎng)可編程門陣列)、ASIC(專用集成電路)等。在各個(gè)分類中,芯片巨頭們各有千秋,接下來(lái)還要考驗(yàn)落地情況。
群雄混戰(zhàn)
芯片目前主要是提供算力支持,2018年,AI芯片大廠和創(chuàng)業(yè)公司們均有不少新動(dòng)作。
最大的玩家當(dāng)屬英偉達(dá)和英特爾。英偉達(dá)的GPU抓住了計(jì)算設(shè)備需求的關(guān)鍵時(shí)機(jī),在圖形渲染、人工智能和區(qū)塊鏈領(lǐng)域的計(jì)算表現(xiàn)突出,希望成為真正的算力平臺(tái),其中,英偉達(dá)在訓(xùn)練方面的代表芯片就是Tesla V100。由于英偉達(dá)GPU布局AI的時(shí)間早于英特爾、賽靈思等公司,整體生態(tài)較為完整,產(chǎn)品在IT公司中得到廣泛應(yīng)用。
英特爾則通過(guò)收購(gòu)案來(lái)彌補(bǔ)AI芯片的賽道:2015年167億美金收購(gòu)FPGA巨頭Altera。FPGA在云計(jì)算、物聯(lián)網(wǎng)、邊緣計(jì)算等方面有很大的潛力。隨著5G浪潮的到來(lái),物聯(lián)網(wǎng)的數(shù)據(jù)分析及計(jì)算需求會(huì)暴增,物聯(lián)網(wǎng)的接入節(jié)點(diǎn)至少是數(shù)百億級(jí)的規(guī)模,比手機(jī)規(guī)模要高出1-2個(gè)數(shù)量級(jí)。物聯(lián)網(wǎng)的典型需求是需要靈活使用算法的變化,這是FPGA的強(qiáng)項(xiàng),F(xiàn)PGA可以通過(guò)自身結(jié)構(gòu)的改變來(lái)適應(yīng)定制化計(jì)算場(chǎng)景的需求,能為不同類型的設(shè)備提供高效芯片。
同時(shí),英特爾還收購(gòu)了Nervana,計(jì)劃用這家公司在深度學(xué)習(xí)方面的能力來(lái)對(duì)抗GPU,Nervana的最新版深度學(xué)習(xí)芯片將在2019年量產(chǎn)。此外,英特爾還收購(gòu)了視覺(jué)處理芯片初創(chuàng)公司 Movidius、自動(dòng)駕駛公司Mobileye。
算法巨頭谷歌則另辟蹊徑,以ASIC類型的芯片來(lái)滿足自身需求。具體來(lái)看,谷歌的TPU通過(guò)脈動(dòng)陣列(systolic array)這一核心架構(gòu)來(lái)提升算力,2018年發(fā)布的TPU3.0版本采用8位低精度計(jì)算節(jié)省晶體管,速度能加快最高100PFlops(每秒1000萬(wàn)億次浮點(diǎn)計(jì)算)。
再看國(guó)內(nèi),華為在2018年10月發(fā)布了兩顆AI芯片——昇騰910(max)和昇騰310(mini)。昇騰910主要用于云端計(jì)算,其半精度算力達(dá)到了256 TFLOPS,預(yù)計(jì)將于2019年第二季度量產(chǎn);昇騰310用于終端低功耗場(chǎng)景,擁有8TFLOPS半精度計(jì)算力,目前已經(jīng)量產(chǎn),但是并不對(duì)外銷售。
國(guó)內(nèi)的明星初創(chuàng)企業(yè)也紛紛獲得投資或者收購(gòu)。2018年中,寒武紀(jì)推出面向數(shù)據(jù)中心市場(chǎng)云端智能芯片 MLU100,浪潮、聯(lián)想、曙光的AI服務(wù)器產(chǎn)品將搭載MLU100 芯片。但是在手機(jī)端,華為麒麟芯片將用達(dá)芬奇架構(gòu)代替寒武紀(jì)架構(gòu)。另一家公司地平線選擇自動(dòng)駕駛的場(chǎng)景,奧迪是其合作伙伴。產(chǎn)品包括基于旭日2.0處理器架構(gòu)的XForce邊緣AI計(jì)算平臺(tái)、基于征程(Journey)2.0 架構(gòu)的地平線 Matrix 自動(dòng)駕駛計(jì)算平臺(tái)、核心板旭日X1600、智能攝像機(jī)解決方案等。
深鑒科技則在2018年被賽靈思收購(gòu),價(jià)格約3億美元。深鑒科技一方面提供基于神經(jīng)網(wǎng)絡(luò)深度壓縮技術(shù)和DPU平臺(tái),為深度學(xué)習(xí)提供端到端的解決方案。另一方面通過(guò)神經(jīng)網(wǎng)絡(luò)與FPGA的協(xié)同優(yōu)化,提供高性價(jià)比的嵌入式端與云端的推理平臺(tái),已應(yīng)用于安防、數(shù)據(jù)中心、汽車等領(lǐng)域。
挑戰(zhàn)與趨勢(shì)
整體而言,英偉達(dá)的實(shí)力在第一梯隊(duì),但是競(jìng)爭(zhēng)者眾多,除了上述企業(yè)外,AMD、高通、聯(lián)發(fā)科、三星等公司均在AI芯片上有所布局,并且戰(zhàn)況愈發(fā)激烈。
不過(guò),目前在AI芯片領(lǐng)域沒(méi)有哪一家占據(jù)絕對(duì)優(yōu)勢(shì),集邦咨詢向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:“初創(chuàng)企業(yè)方面,就我們的觀察,畢竟仍在草創(chuàng)階段,客戶的采用意愿,以及導(dǎo)入后,終端市場(chǎng)的接受狀況,將是未來(lái)需要觀察的地方?偨Y(jié)來(lái)看,還是國(guó)際芯片大廠的布局速度較快!
從國(guó)內(nèi)和國(guó)外的角度看,一位AI業(yè)內(nèi)人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者:“國(guó)內(nèi)外主要是技術(shù)結(jié)構(gòu)上的差距,底層技術(shù)科學(xué)上和國(guó)外的差距顯著,但是應(yīng)用層面上差距不大,甚至有創(chuàng)新的應(yīng)用點(diǎn)。不少AI芯片公司通過(guò)定制化服務(wù)小規(guī)?蛻,針對(duì)B端場(chǎng)景進(jìn)行開(kāi)發(fā),比如專門處理語(yǔ)音、圖像!
同時(shí),AI芯片也面臨不少挑戰(zhàn),杜克大學(xué)教授陳怡然就曾提到,AI芯片在設(shè)計(jì)方面有四大挑戰(zhàn)。
其一是大容量存儲(chǔ)和高密度計(jì)算,當(dāng)神經(jīng)深度學(xué)習(xí)網(wǎng)絡(luò)的復(fù)雜度越來(lái)越高的時(shí)候,參數(shù)也會(huì)越來(lái)越多,怎么處理是一大難題;第二個(gè)挑戰(zhàn)是要面臨特定領(lǐng)域的架構(gòu)設(shè)計(jì),因?yàn)閳?chǎng)景越來(lái)越豐富,這些場(chǎng)景的計(jì)算需求是完全不一樣的。怎么樣通過(guò)對(duì)于不同的場(chǎng)景的理解,設(shè)置不同的硬件架構(gòu)變得非常重要。
第三個(gè)挑戰(zhàn)是芯片設(shè)計(jì)要求高,周期長(zhǎng),成本昂貴。從芯片規(guī)格設(shè)計(jì)、芯片結(jié)構(gòu)設(shè)計(jì)、RTL設(shè)計(jì)、物理版圖設(shè)計(jì)、晶圓制造、晶圓測(cè)試封裝,需要2到3年時(shí)間,正常的時(shí)間里軟件會(huì)有一個(gè)非?焖俚陌l(fā)展。但是算法在這個(gè)期間內(nèi)將會(huì)快速更新,芯片如何支持這些更新也是難點(diǎn)。
第四個(gè)挑戰(zhàn)是架構(gòu)及工藝。隨著工藝不斷的提升,從90納米到10納米,邏輯門生產(chǎn)的成本到最后變得飽和。也許在速度上、功耗上會(huì)有提升,但單個(gè)邏輯生產(chǎn)的成本不會(huì)再有新的下降。這種情況下如果仍然用幾千甚至上萬(wàn)個(gè)晶體管去做一個(gè)比較簡(jiǎn)單的深度學(xué)習(xí)的邏輯,最后在成本上是得不償失的。
在芯片的產(chǎn)業(yè)鏈中,生產(chǎn)環(huán)節(jié)主要依靠臺(tái)積電、格芯等芯片代工廠商。但是國(guó)內(nèi)在設(shè)計(jì)領(lǐng)域逐步前進(jìn),并且AI專用芯片相對(duì)于CPU、GPU來(lái)說(shuō)難度沒(méi)有那么大,因此不少創(chuàng)業(yè)公司也為自己精通的行業(yè)定制AI芯片。
2018年以來(lái),不少以算法為主的語(yǔ)音、視覺(jué)、自動(dòng)駕駛等公司也開(kāi)始研發(fā)AI芯片,將算法和芯片進(jìn)行更好的結(jié)合,來(lái)針對(duì)多樣化的場(chǎng)景,未來(lái)軟硬結(jié)合將會(huì)是趨勢(shì)。