飛象網(wǎng)訊 (計(jì)育青/文)如今人工智能技術(shù)已經(jīng)在各行各業(yè)投入了廣泛應(yīng)用,從居民小區(qū)門禁系統(tǒng)的人臉識(shí)別到工廠流水線上的產(chǎn)品自動(dòng)檢測(cè),從兒童玩具中的語(yǔ)音對(duì)答到在線商城的客服機(jī)器人,人工智能已經(jīng)在人們工作和生活的方方面面發(fā)揮了重要作用。在經(jīng)歷了前期各個(gè)領(lǐng)域的分散性探索之后,人工智能技術(shù)開始向著通用大模型時(shí)代發(fā)展。
在近日舉行的2022年華為全聯(lián)接大會(huì)上,中國(guó)科學(xué)技術(shù)信息研究所黨委書記、所長(zhǎng)、科技部新一代人工智能發(fā)展研究中心主任趙志耘表示,大模型具備更強(qiáng)的泛化能力,可以覆蓋更為多樣化的業(yè)務(wù)場(chǎng)景,因此產(chǎn)學(xué)研各界一致認(rèn)為大模型已經(jīng)成為當(dāng)前人工智能技術(shù)發(fā)展的重要方向。在此次大會(huì)上,趙志耘宣布中國(guó)科學(xué)技術(shù)信息研究所正在與業(yè)界合作規(guī)劃大模型地圖,不久之后就會(huì)發(fā)布《中國(guó)人工智能大模型地圖研究報(bào)告》,統(tǒng)籌中國(guó)大模型有序發(fā)展,共同推進(jìn)相關(guān)應(yīng)用開發(fā)和方案落地。
從追趕到領(lǐng)先
在過(guò)去十年間,人工智能技術(shù)和應(yīng)用都發(fā)展迅猛,不但傳統(tǒng)深度學(xué)習(xí)模型持續(xù)快速演進(jìn),以Transformer為代表的新型網(wǎng)絡(luò)模型、訓(xùn)練微調(diào)機(jī)制的應(yīng)用也經(jīng)歷了飛速增長(zhǎng)。短短5年里,原本不到億級(jí)的參數(shù)規(guī)模就增長(zhǎng)到如今萬(wàn)億級(jí)別規(guī)模。
趙志耘表示,各國(guó)圍繞著人工智能大模型的研發(fā)做了很多工作,總的來(lái)說(shuō),該領(lǐng)域的主導(dǎo)權(quán)掌握在中美兩國(guó)手中。美國(guó)對(duì)大模型的研究啟動(dòng)比較早,并且一直維持著較大的投入,不過(guò)中國(guó)近幾年也加快了追趕的步伐。在科研機(jī)構(gòu)與企業(yè)界的聯(lián)手推動(dòng)下,從硬件到軟件,從底層技術(shù)到上層應(yīng)用,國(guó)內(nèi)取得了豐碩的成果。在此期間,人工智能計(jì)算中心也在全國(guó)各地紛紛落地,為大模型的孵化提供了強(qiáng)有力的算力支撐。
2020年到2021年,中國(guó)大模型數(shù)量從2個(gè)驟增至21個(gè),基本與美國(guó)處于同等量級(jí),大幅領(lǐng)先于世界其他各國(guó)。在此期間,國(guó)內(nèi)還出現(xiàn)了基于昇騰的鵬程、盤古、紫東、太初、悟道等千億甚至萬(wàn)億級(jí)別的大模型,引起了業(yè)界的廣泛關(guān)注。
進(jìn)步與挑戰(zhàn)
為全方位了解國(guó)內(nèi)大模型發(fā)展的現(xiàn)狀,中國(guó)科學(xué)技術(shù)信息研究所聯(lián)合產(chǎn)業(yè)力量,共同對(duì)中國(guó)人工智能大模型的發(fā)展現(xiàn)狀進(jìn)行了調(diào)研,從分布、要素、活躍度和應(yīng)用等方面,揭示了中國(guó)人工智能大模型取得的進(jìn)步、面臨的挑戰(zhàn),為下一步統(tǒng)籌規(guī)劃大模型的發(fā)展和應(yīng)用提供了一套有效的方法工具。
從分布、要素、活躍度和應(yīng)用四個(gè)維度出發(fā),中國(guó)科學(xué)技術(shù)信息研究所繪制了多個(gè)大模型分布地圖。從地域上看,全國(guó)很多地方都在開發(fā)大模型,不過(guò)主要集中在北京、深圳、西安、武漢等國(guó)家新一代人工智能發(fā)展試驗(yàn)區(qū);從專注領(lǐng)域來(lái)看,現(xiàn)有的大模型主要集中在NLP和多模態(tài)方面,其它領(lǐng)域相對(duì)較少。從要素地圖來(lái)看,最關(guān)鍵的是算力和人才,大算力和頂尖人才也是大模型發(fā)展不可或缺的要素。從活躍度地圖來(lái)看,無(wú)論在學(xué)術(shù)方面還是在開源技術(shù)方面,中國(guó)依然缺少具有全球影響力的大模型,未來(lái)需要強(qiáng)強(qiáng)聯(lián)合,共同打造精英級(jí)大模型。從應(yīng)用地圖來(lái)看,國(guó)內(nèi)大模型已經(jīng)開始進(jìn)行落地試驗(yàn)、試點(diǎn),但總量上還比較少。
趙志耘表示,總的來(lái)看,國(guó)內(nèi)大模型發(fā)展的要素缺乏統(tǒng)籌,資源浪費(fèi)和資源不足同時(shí)存在,同時(shí)大模型的開發(fā)缺乏協(xié)作,發(fā)展比較分散,暫未出現(xiàn)現(xiàn)象級(jí)別標(biāo)桿大模型。從落地商用的角度來(lái)看,大模型的產(chǎn)業(yè)落地仍有很多困難,未能對(duì)實(shí)體經(jīng)濟(jì)產(chǎn)生足夠的促進(jìn)作用。
三個(gè)建議
據(jù)趙志耘介紹,完整版的“中國(guó)人工智能大模型地圖研究報(bào)告”將在不久后正式對(duì)外公布,報(bào)告中綜合分析了中國(guó)人工智能大模型地圖,并對(duì)中國(guó)人工智能大模型的未來(lái)發(fā)展提出了三個(gè)建議。首先是大模型發(fā)展布局應(yīng)該有統(tǒng)籌規(guī)劃,匯聚大模型發(fā)展的相關(guān)要素,同時(shí)加強(qiáng)發(fā)展人工智能計(jì)算中心和算力網(wǎng)絡(luò),完善人工智能大模型人才培養(yǎng)體系,圍繞國(guó)內(nèi)自主創(chuàng)新的人工智能根技術(shù)來(lái)發(fā)展我國(guó)大模型。其次,大力推進(jìn)場(chǎng)景化創(chuàng)新,提升大模型的活躍度和影響力。第三,政府需要加大支持力度,鼓勵(lì)產(chǎn)學(xué)研各界攜手有條件的領(lǐng)域加速大模型的產(chǎn)業(yè)落地。
華為計(jì)算產(chǎn)品線總裁鄧泰華在會(huì)議期間表示,多年來(lái)華為通過(guò)昇騰構(gòu)建了一站式的大模型開發(fā)平臺(tái),讓大模型更易開發(fā)、易適配、易部署。為促進(jìn)大模型產(chǎn)業(yè)化落地,華為和伙伴結(jié)成產(chǎn)業(yè)聯(lián)合體,共同打通科研創(chuàng)新和產(chǎn)業(yè)落地,讓大模型更好地服務(wù)于各行各業(yè)。在科技部牽頭組織下,華為還與中國(guó)科學(xué)技術(shù)信息研究所等產(chǎn)業(yè)合作伙伴聯(lián)手制定大模型的沙盤,從而有序引導(dǎo)大模型的創(chuàng)新方向!巴ㄟ^(guò)產(chǎn)學(xué)研聯(lián)手,我們構(gòu)建起了大模型規(guī)劃、開發(fā)部署、產(chǎn)業(yè)化落地的全流程使能體系,為中國(guó)人工智能技術(shù)和應(yīng)用發(fā)展探索出了一條行之有效的前進(jìn)之路。”鄧泰華說(shuō)。