李飛飛團(tuán)隊新作登《自然》子刊:如果AI有身體會更智能嗎?
如果AI有身體,它會變得更智能嗎?
答案是,會的。
近日,斯坦福大學(xué)教授李飛飛帶領(lǐng)的團(tuán)隊研究發(fā)現(xiàn),身體形態(tài)會影響虛擬生物Unimal在復(fù)雜環(huán)境的適應(yīng)和學(xué)習(xí)能力,復(fù)雜環(huán)境也會促進(jìn)形態(tài)智能的進(jìn)化。
此項題為《通過學(xué)習(xí)和進(jìn)化實現(xiàn)具身智能》(Embodied intelligence via learning and evolution)的研究登上了《自然·通訊》(Nature Communications)雜志。
“我們通常專注于AI是如何實現(xiàn)人類大腦中神經(jīng)元的功能,然而將AI看作是具有物理實體的東西會是完全不同的范式,”李飛飛表示。
對于此項研究,論文第一作者Agrim Gupta告訴澎湃新聞(www.thepaper.cn),“最終的目標(biāo)將是擁有生活在一個‘由人類創(chuàng)造并且為了人類而創(chuàng)造’的世界的實體智能體!
“現(xiàn)在,我們已經(jīng)看到人工智能在視覺和語言方面的研究取得了巨大進(jìn)展,并將降低在‘虛擬/網(wǎng)絡(luò)’世界中做事的成本。但像幫助老年群體或幫人類做危險的工作這樣真正以一種好的方式影響人類生活的技術(shù),目前還是遙不可及的。所以當(dāng)我們有了擁有物理實體的智能體,這個影響將是巨大的,并且很有希望讓人類更好。”
研究團(tuán)隊創(chuàng)建了一個計算機(jī)模擬的“游樂場”,在那里,被稱為“unimals”(通用動物的縮寫,發(fā)音為“yoo-nimals”)的類節(jié)肢動物智能體學(xué)習(xí)并受到突變和自然選擇的影響。
每個環(huán)境的模擬都從576個獨(dú)特的unimals開始,它們由一個“球體”(頭部)和一個“身體”組成,該“身體”由不同數(shù)量以各種方式排列的圓柱形肢體組成。每個unimal都以相同的方式感知世界,并以相同的神經(jīng)架構(gòu)和學(xué)習(xí)算法開始。換句話說,所有unimals都以相同的智能水平開始了他們的虛擬生活——只是他們的身體形狀不同。
在學(xué)習(xí)階段中,Unimal必須在多變的地形上將一個塊狀物移動到目標(biāo)位置,地形有不同難度——平坦的地形、塊狀山脊、階梯或光滑的山丘。
該團(tuán)隊采用一種錦標(biāo)賽式的達(dá)爾文進(jìn)化方案,在相同的環(huán)境/任務(wù)組合中接受過訓(xùn)練的每個unimal都與其他三個unimal一起參加比賽,獲勝者被選中產(chǎn)生一個單一的后代。該后代在面臨與其父母相同的任務(wù)之前,都要經(jīng)歷涉及肢體或關(guān)節(jié)變化的單一突變。所有的unimals(包括獲勝者)都參加了多次比賽,只有隨著新后代的出現(xiàn)才會老化。
在訓(xùn)練了4000種不同的形態(tài)后,研究人員結(jié)束了模擬。那時,每個環(huán)境幸存下來的unimal平均經(jīng)歷了10代進(jìn)化,成功的形態(tài)多種多樣,包括兩足動物、三足動物和四足動物,有或沒有手臂。
在每個環(huán)境中完成3次這樣的進(jìn)化(訓(xùn)練4000種不同的形態(tài))后,研究團(tuán)隊再從每個環(huán)境中選擇前10名表現(xiàn)最佳的動物,并從頭開始訓(xùn)練它們執(zhí)行八項全新任務(wù),例如繞過障礙物、操縱球或推動一個盒子向上傾斜。
最后發(fā)現(xiàn),在變化地形中的unimal進(jìn)化地比平坦地形中的更好,在變化地形中操縱盒子的unimal表現(xiàn)最好。進(jìn)化10代以后,最成功的unimal在形態(tài)上已經(jīng)適應(yīng)得非常好,他們學(xué)習(xí)同樣任務(wù)的時間是最早一代的一半。
這也與美國心理學(xué)家詹姆斯·馬克·鮑德溫 (James Mark Ba ldwin) 在19世紀(jì)后期提出的假設(shè)一致,他推測學(xué)習(xí)具有適應(yīng)性優(yōu)勢(adaptive advantage)事物的能力可以通過達(dá)爾文的自然選擇傳遞下去。Gupta解釋,“自然會選擇能更快地獲得優(yōu)勢行為的身體變化”。
由于在更復(fù)雜環(huán)境中進(jìn)化的智能體可以更快更好地學(xué)習(xí)新任務(wù),Gupta和他的同事認(rèn)為,允許模擬實體智能體(embodied agent)在日益復(fù)雜的環(huán)境中進(jìn)化將為開發(fā)在現(xiàn)實世界中執(zhí)行多項任務(wù)的機(jī)器人提供啟示。
Gupta說,“人類不一定知道如何為奇怪的任務(wù)設(shè)計機(jī)器人身體,例如爬過核反應(yīng)堆提取廢物,地震后提供救災(zāi),引導(dǎo)納米機(jī)器人在人體內(nèi)運(yùn)動,包括做洗碗或折疊衣物等家務(wù)。 也許唯一的出路是讓進(jìn)化來設(shè)計這些機(jī)器人!
在面對這項研究將會如何具體幫助這些任務(wù)的實現(xiàn)的疑問,Gupta向澎湃新聞表示,“另一個看待此項研究的方式不再是創(chuàng)造了智能算法(intelligent algorithms),而是你可以有正確的物理形式,從而輕松完成手頭的任務(wù)。從這個意義上說,理論上你可以優(yōu)化折疊衣服的機(jī)器人的形式!
對于下一步的研究計劃,Gupta透露,當(dāng)前的工作幾乎只涉及了表面,現(xiàn)在的模擬環(huán)境和學(xué)習(xí)行為都還非常簡單,“我們希望能擴(kuò)大范圍,同時,將現(xiàn)在的一個智能體擴(kuò)展成多個智能體也是一個有趣的方向!