6月14日,2024北京智源大會(huì)在京舉行。百度首席技術(shù)官王海峰受邀出席并作主旨演講,對(duì)人工智能技術(shù)發(fā)展作出最新判斷。王海峰認(rèn)為,大模型為通用人工智能帶來(lái)曙光,可以從兩個(gè)角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。從人工智能技術(shù)發(fā)展趨勢(shì)來(lái)看,未來(lái)幾年,規(guī)模定律依然有效,大語(yǔ)言模型仍有很大提升空間,多模態(tài)大模型會(huì)越來(lái)越好用,智能體技術(shù)逐漸成熟加速應(yīng)用爆發(fā)等。
通用人工智能新視角:技術(shù)通用、能力全面
人工智能是模擬、延伸和擴(kuò)展人的智能。王海峰認(rèn)為,大模型為通用人工智能帶來(lái)曙光,可以從兩個(gè)角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。
人工智能技術(shù)歷經(jīng)幾十年發(fā)展,從早期的人工撰寫(xiě)規(guī)則,到后來(lái)統(tǒng)計(jì)機(jī)器學(xué)習(xí),可以自動(dòng)從數(shù)據(jù)中學(xué)習(xí),但解決不同場(chǎng)景的問(wèn)題需要不同的算法,演進(jìn)到深度學(xué)習(xí)時(shí)代,算法的通用性大大加強(qiáng),深度神經(jīng)網(wǎng)絡(luò)一套架構(gòu)和技術(shù)可以解決各種問(wèn)題,再到大模型時(shí)代,除了算法,模型也變得更加通用和統(tǒng)一。
在技術(shù)的通用性方面,大模型在解決不同任務(wù)、語(yǔ)言、模態(tài)、場(chǎng)景的通用性都變得越來(lái)越好。以自然語(yǔ)言處理為例,之前有分詞、句法分析、語(yǔ)義匹配、機(jī)器翻譯、問(wèn)答、對(duì)話等等很多個(gè)子方向,現(xiàn)在一個(gè)大語(yǔ)言模型就可以解決絕大多數(shù)任務(wù);語(yǔ)言方面,大模型既可以解決單語(yǔ)言的問(wèn)題,也可以跨語(yǔ)言,不僅學(xué)習(xí)了人類的自然語(yǔ)言,也學(xué)習(xí)了人工定義的形式語(yǔ)言,架起了從思考到執(zhí)行的橋梁;同時(shí),大模型也可以實(shí)現(xiàn)多模態(tài)的統(tǒng)一建模,廣泛賦能各行各業(yè)應(yīng)用,等等?傮w上,人工智能技術(shù)的通用性越來(lái)越強(qiáng)。
在能力的全面性方面,理解、生成、邏輯、記憶是人工智能的四項(xiàng)基礎(chǔ)能力,其他各項(xiàng)人工智能的典型能力,無(wú)論是創(chuàng)作、解題、代碼,還是規(guī)劃、決策等等,基本上都是這四項(xiàng)基礎(chǔ)能力的綜合運(yùn)用。這四項(xiàng)能力越強(qiáng),越接近通用人工智能。
文心大模型技術(shù)解讀
文心一言是百度自主研發(fā)的新一代知識(shí)增強(qiáng)大語(yǔ)言模型,基于更強(qiáng)平臺(tái)、更優(yōu)數(shù)據(jù)和更好算法訓(xùn)練,從萬(wàn)億數(shù)據(jù)和千億知識(shí)中融合學(xué)習(xí),突破知識(shí)內(nèi)化與外用技術(shù),具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的核心技術(shù),在基礎(chǔ)模型訓(xùn)練、數(shù)據(jù)構(gòu)建與優(yōu)化、對(duì)齊技術(shù)創(chuàng)新、提示優(yōu)化、智能體機(jī)制等方面進(jìn)一步創(chuàng)新突破。
智能體是在基礎(chǔ)模型上,進(jìn)一步進(jìn)行思考增強(qiáng)訓(xùn)練,包括思考過(guò)程的有監(jiān)督精調(diào)、行為決策的偏好學(xué)習(xí)、結(jié)果反思的增強(qiáng)學(xué)習(xí),進(jìn)而得到思考模型。智能體的思考模型可以調(diào)用工具來(lái)完成任務(wù)。代碼智能體首先通過(guò)思考模型理解用戶需求,經(jīng)過(guò)思考,把完成任務(wù)的指令和相關(guān)信息整合成提示,輸入給代碼解釋器;然后,代碼解釋器根據(jù)提示,把自然語(yǔ)言表達(dá)的用戶需求翻譯成代碼并執(zhí)行,相當(dāng)于“用模型寫(xiě)代碼讓復(fù)雜的任務(wù)變簡(jiǎn)單”。
公開(kāi)資料顯示,百度自2010年起開(kāi)始全面布局人工智能,2019年3月推出文心大模型1.0,持續(xù)迭代升級(jí), 去年10月發(fā)布文心大模型4.0。文心大模型的持續(xù)快速進(jìn)化,得益于百度在芯片、框架、模型和應(yīng)用上的全棧布局,尤其是飛槳深度學(xué)習(xí) 平臺(tái)和文心的聯(lián)合優(yōu)化。文心大模型的周均訓(xùn)練有效率達(dá)到98.8%,相比一年前文心一言發(fā)布時(shí),訓(xùn)練效率提升到當(dāng)時(shí)的5.1倍,推理105倍。
人工智能進(jìn)入工業(yè)大生產(chǎn)
對(duì)于人工智能技術(shù)的進(jìn)一步發(fā)展,王海峰強(qiáng)調(diào),規(guī)模定律未來(lái)若干年仍將有效;大語(yǔ)言模型現(xiàn)在能力很強(qiáng),還在快速進(jìn)步,未來(lái)仍有很大提升空間;多模態(tài)大模型會(huì)越來(lái)越好用;智能體技術(shù)會(huì)越來(lái)越成熟。人工智能技術(shù)正在加速進(jìn)步,產(chǎn)業(yè)進(jìn)入爆發(fā)期。
王海峰認(rèn)為,縱觀人類經(jīng)歷的前三次工業(yè)革命,其核心驅(qū)動(dòng)力量機(jī)械技術(shù)、電氣技術(shù)和信息技術(shù)都有很強(qiáng)的通用性,會(huì)應(yīng)用于各行各業(yè),當(dāng)它們呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的工業(yè)大生產(chǎn)特征,核心技術(shù)就進(jìn)入工業(yè)大生產(chǎn)階段。人工智能基于深度學(xué)習(xí)及大模型工程平臺(tái),包括算法、數(shù)據(jù)、模型、工具等,也已經(jīng)具備了非常強(qiáng)的通用性,并且具備了標(biāo)準(zhǔn)化、模塊化和自動(dòng)化的特征,所以深度學(xué)習(xí)及大模型工程平臺(tái)推動(dòng)人工智能進(jìn)入到了工業(yè)大生產(chǎn)階段,通用人工智能將加速到來(lái)。