9月13日電 隨著生成式人工智能的發(fā)展,對(duì)大語(yǔ)言模型的需求越發(fā)明顯。日前在沙特首都利雅得舉行的第三屆全球人工智能峰會(huì)上,沙特?cái)?shù)據(jù)與人工智能局發(fā)布了目前最大規(guī)模的阿拉伯語(yǔ)大語(yǔ)言模型,與會(huì)代表探討如何讓人工智能技術(shù)賦能阿拉伯世界,在全球化中保護(hù)語(yǔ)言、身份和文化的多樣性。
沙特?cái)?shù)據(jù)與人工智能局介紹說(shuō),該機(jī)構(gòu)研發(fā)的擁有70億個(gè)參數(shù)的阿拉伯語(yǔ)大語(yǔ)言模型ALLaM已經(jīng)上線微軟的云平臺(tái),訓(xùn)練數(shù)據(jù)集包含5千億個(gè)阿拉伯語(yǔ)基本文本單元。
與會(huì)嘉賓表示,在發(fā)展大語(yǔ)言模型中保護(hù)文化身份,首先還是來(lái)自高質(zhì)量數(shù)據(jù)集的挑戰(zhàn)。要收集多樣化的數(shù)據(jù)集,包括方言、習(xí)語(yǔ)和文化的細(xì)微差別。這種數(shù)據(jù)的多樣性使人工智能不僅可以作為一種技術(shù)工具,也可以作為跨越文化鴻溝的橋梁。模型訓(xùn)練過(guò)程中,需要聘請(qǐng)來(lái)自不同文化的數(shù)據(jù)標(biāo)注者,盡管這是一個(gè)復(fù)雜且昂貴的過(guò)程,但對(duì)于確保人們平等受益于大型語(yǔ)言模型帶來(lái)的技術(shù)進(jìn)步,保證人工智能的普惠性非常重要。
人工智能公司Emotech首席執(zhí)行官莊宏斌在此次大會(huì)的主旨演講中,介紹了“小語(yǔ)言模型”的概念。小型語(yǔ)言模型,是大型語(yǔ)言模型的緊湊版本。它們旨在高效執(zhí)行語(yǔ)言相關(guān)任務(wù),同時(shí)消耗較少的計(jì)算資源。與可能由數(shù)千億個(gè)參數(shù)組成的大型語(yǔ)言模型不同,小型語(yǔ)言模型的特點(diǎn)是參數(shù)數(shù)量較少,適合數(shù)據(jù)資源有限的方言語(yǔ)言模型,適合部署在移動(dòng)設(shè)備或邊緣計(jì)算設(shè)備等資源受限的環(huán)境中。
與會(huì)嘉賓表示,隨著人工智能技術(shù)的發(fā)展,其在調(diào)整和塑造人類(lèi)互動(dòng)文化方面的潛力也在增長(zhǎng)。然而,挑戰(zhàn)在于如何確保這些技術(shù)的開(kāi)發(fā)具有包容性,尊重全球用戶(hù)的語(yǔ)言和文化多樣性。技術(shù)的包容性和語(yǔ)言文化的多樣性應(yīng)作為未來(lái)真正全球人工智能格局的基礎(chǔ)。
第三屆全球人工智能峰會(huì)于10日至12日在利雅得舉行,峰會(huì)主題是“利用人工智能造福人類(lèi)”。