今年 Google I/O 的風(fēng)頭都被“成了精“的 Google Assistant,以及背后的 Duplex 技術(shù)搶了。人們發(fā)現(xiàn),人工智能已經(jīng)能用跟人一樣的語(yǔ)氣說(shuō)話,以假亂真……但其實(shí),除了讓人工智能“張嘴“像人,Google的另一項(xiàng)技術(shù)更新還讓我們看到了人工智能“睜開(kāi)眼”后的景象:它能看到你看到的,以及你“看不到”的。
可以說(shuō),人工智能一睜眼,接下來(lái)就沒(méi)你什么事了。
換句話說(shuō),Google 想把以前通過(guò)打字或語(yǔ)音錄入完成的搜索行為,改由簡(jiǎn)單的打開(kāi)攝像頭來(lái)完成:你想了解的建筑、想吃的餐館、想買(mǎi)的衣服、甚至想走的路,在你打開(kāi)攝像頭后,基本信息就通通呈現(xiàn)在眼前。
那些你已經(jīng)習(xí)慣的復(fù)雜操作流程,終于不存在了。
在相機(jī)和 Google Assistant 里,都可以啟動(dòng) Lens
那么,Lens 都能“看見(jiàn)”什么呢?
識(shí)別物品并做出行動(dòng)建議最基本的是拍照“識(shí)動(dòng)物”、“識(shí)植物”等,總之那些有千奇百怪的種類(lèi)的物品,它都能給你識(shí)別的清清楚楚,告訴你眼前這東西究竟是哪一個(gè)品種或款式。
Lens 還能識(shí)別文字,除了靜態(tài)呈現(xiàn),Google 還設(shè)計(jì)了自動(dòng)聯(lián)網(wǎng)的功能:掃描一段 Wi-Fi 的用戶(hù)名/密碼/條形碼,然后讓手機(jī)自動(dòng)連接到網(wǎng)絡(luò)上,省去手動(dòng)查找網(wǎng)絡(luò)、輸入密碼的繁瑣。
Lens 還能將識(shí)別的文字轉(zhuǎn)為可供編輯格式,同時(shí)還將翻譯功能融入,用戶(hù)可以第一時(shí)間進(jìn)行翻譯。
Google 還把愛(ài)剁手的用戶(hù)研究的透透的,知道你看見(jiàn)一個(gè)好看的衣服、家具,就想要自己也買(mǎi)一個(gè)……
這也是為什么 Lens 加強(qiáng)了對(duì)衣物、家具、書(shū)籍等等不同種類(lèi)商品的識(shí)別能力,比如鏡頭對(duì)準(zhǔn)一本書(shū),就能告訴你這書(shū)的簡(jiǎn)介。如果商品可以網(wǎng)購(gòu)的話,還會(huì)直接給出購(gòu)買(mǎi)鏈接……
看到心儀的商品,掏出手機(jī)進(jìn)行識(shí)別,一鍵下單。多方便!
(恩,終于追上淘寶了)
人工智能就是這么貼心,不會(huì)讓你多動(dòng)一下手指。去年剛剛發(fā)布時(shí),Lens 需要你像拍照一樣點(diǎn)擊一下屏幕,之后經(jīng)過(guò)分析后才能顯示信息。但今年 Lens 進(jìn)化得更好了,可以對(duì)看到的物品進(jìn)行實(shí)時(shí)的分析。
怎么樣,很(可怕)方便吧?
不過(guò),Lens 的識(shí)別能力仍有待加強(qiáng),它受到拍照的光線角度、背后機(jī)器學(xué)習(xí)的數(shù)據(jù)庫(kù)情況等綜合影響,總的來(lái)說(shuō)是一項(xiàng)很難實(shí)現(xiàn)的技術(shù)。在我的使用中,就出現(xiàn)過(guò)幾次有趣的錯(cuò)誤。比如下面,Lens 將一個(gè) 7-11 給我的破紙袋,識(shí)別成了奢侈品牌包包。
(實(shí)話講,明明就是很像……)
在這種情況下,Google Lens會(huì)將不確定的答案以問(wèn)句說(shuō)出。但Google Lens的識(shí)別能力的確還是任重道遠(yuǎn)。
索引真實(shí)世界,精確定位 Google 的人工智能絕不滿(mǎn)足于看見(jiàn)世界,它還要知道在這個(gè)世界里,自己究竟在哪。
比如你來(lái)到一個(gè)新的城市,不知道該去哪家餐館,也可以打開(kāi) Lens 對(duì)著隨便一家餐館掃描,它能找到對(duì)應(yīng)的餐館資料顯示給你看,包括點(diǎn)名、菜式、評(píng)分、打烊時(shí)間等等。
顯然,這單獨(dú)靠機(jī)器視覺(jué)是無(wú)法實(shí)現(xiàn)的。
Google 進(jìn)一步將 Lens 與地圖產(chǎn)品結(jié)合,開(kāi)發(fā)了所謂一個(gè)“視覺(jué)定位系統(tǒng)”(Visual Positioning System, VPS) 的技術(shù)。
VPS 主要的功能是幫助設(shè)備和 Google 服務(wù)了解自己的準(zhǔn)確所在——從室外一直到室內(nèi),精確到具體在地板上,還是在壁櫥里——厘米級(jí)的精確定位。
VPS 還有另一個(gè)神奇的效果,能夠把地圖的導(dǎo)航變成增強(qiáng)現(xiàn)實(shí)版本!
這個(gè)功能的使用場(chǎng)景是這樣的:當(dāng)你走出地鐵站想要去某個(gè)地方時(shí),總是打開(kāi)地圖,看一下代表你自己的那個(gè)小光標(biāo)的面向,才能確認(rèn)該往那個(gè)方向走……然而問(wèn)題是這個(gè)定位通常要很長(zhǎng)的時(shí)間,大量調(diào)試之后才能變準(zhǔn)確。
現(xiàn)在,打開(kāi)Google Lens,就會(huì)出現(xiàn)一個(gè)虛擬的箭頭,直接出現(xiàn)在真實(shí)世界中,指引你左轉(zhuǎn)右轉(zhuǎn)。路癡福音啊!
你還可以選擇讓一個(gè)虛擬的小狐貍給你帶路:
要是把 Google的所有人工智能技術(shù)想象成一個(gè)人,那么 Lens 一定就是它的眼睛了。
在推出一年后,Google 打算讓 Lens 進(jìn)入更多人的手機(jī)攝像頭里,宣布從今年開(kāi)始將直接集成到小米、摩托羅拉、LG、一加、大法和諾基亞等多個(gè)品牌旗艦手機(jī)里。
是的你沒(méi)有看錯(cuò)!打開(kāi)這些手機(jī)默認(rèn)的照相機(jī)應(yīng)用,就可以使用強(qiáng)大的 Lens 功能了!
誰(shuí)說(shuō) Google 的黑科技只屬于親兒子的?
iOS 用戶(hù)也沒(méi)有被遺忘!Google 的云相冊(cè)應(yīng)用 Photos 本就支持 iOS 平臺(tái),而不久之后其應(yīng)用就將更新,加入對(duì) Lens 的支持。
從這一年 Google 在 Lens 上做的更新,還能看到這家公司正在踐行“讓人工智能普及化” (democratize AI) 的口號(hào),在推廣人工智能上堅(jiān)持的是生活化、擬人化的有趣思路。
這對(duì)于 Google 來(lái)說(shuō)至關(guān)重要,因?yàn)橛脩?hù)需要明白人工智能其實(shí)離自己很近,而越多的用戶(hù)使用Google 的人工智能,對(duì)于這家公司越有利。
最后,一個(gè)小細(xì)節(jié):由于 Lens 屬于 Google Assistant 集成的功能,考慮到后者還未支持中文,所以用戶(hù)如果在國(guó)內(nèi)體驗(yàn) Lens,還是需要先將系統(tǒng)調(diào)成英文。