飛象原創(chuàng)(高靖宇/文)站在2024年的技術(shù)十字路口,AI正在全面改造手機(jī)行業(yè),無(wú)論是在功能創(chuàng)新還是用戶體驗(yàn)上,AI驅(qū)動(dòng)的手機(jī)都讓人眼前一亮。從硬件升級(jí)到智能化的深度融合,手機(jī)廠商都在加速擁抱AI。
對(duì)于手機(jī)廠商來(lái)說(shuō),AI不僅僅是“能做什么”,而是“能為你做什么”,如何讓AI“更懂你”,利用AI實(shí)現(xiàn)更高效的用戶體驗(yàn),這正是驅(qū)動(dòng)AI手機(jī)未來(lái)發(fā)展的核心意義所在。
10月10日,2024 vivo開發(fā)者大會(huì)上,vivo正式發(fā)布“藍(lán)心智能”AI戰(zhàn)略,其中PhoneGPT(即“手機(jī)智能體”),是vivo基于藍(lán)心大模型技術(shù)做出的一次全新探索。而從“智能”到“智能體”這一字之差的變化,標(biāo)志著AI手機(jī)進(jìn)入到一個(gè)全新的個(gè)人智能體時(shí)代。
PhoneGPT:AI手機(jī)的全新蛻變
回想AI與手機(jī)的初遇,還是在Siri、Google Assistant等語(yǔ)音助手的出現(xiàn),讓人們第一次感受到了“智能”的觸手可及。用戶可以通過(guò)簡(jiǎn)單的語(yǔ)音命令讓手機(jī)完成任務(wù),例如查詢天氣、設(shè)定提醒或是發(fā)短信。然而,這類助手的局限性很快顯現(xiàn):它們大多只能基于關(guān)鍵詞作出反應(yīng),無(wú)法真正理解用戶的意圖。你問(wèn),它答,流程機(jī)械而僵化,遠(yuǎn)不能稱之為“智能”。
大模型的應(yīng)用使得手機(jī)AI能力有了革命性的提升,“AI手機(jī)”已經(jīng)是完全不同的概念,AI技術(shù)在語(yǔ)音識(shí)別、圖像識(shí)別、智能推薦等方面更是取得了長(zhǎng)足進(jìn)步,給用戶帶來(lái)了全新的使用體驗(yàn)。
不過(guò),AI手機(jī)依然沒(méi)有擺脫“你問(wèn)我答”的模式,也就是用戶必須清晰地表達(dá)命令,手機(jī)才能作出反應(yīng),遠(yuǎn)未達(dá)到“懂你”的地步。而vivo發(fā)布的PhoneGPT,具備自主拆解需求、主動(dòng)規(guī)劃路徑、實(shí)時(shí)環(huán)境識(shí)別、動(dòng)態(tài)反饋決策等能力?梢院(jiǎn)單的理解為,手機(jī)AI能力不再停留在單一功能層面,而是以“智能體”的形式具備了完整“思考”用戶需求的能力。
據(jù)vivo副總裁周圍介紹,PhoneGPT已可以準(zhǔn)確識(shí)別手機(jī)屏幕界面中的內(nèi)容,并自主操作手機(jī)的電話、短信等各類應(yīng)用程序,完成用戶交代的任務(wù)。
在演示中,藍(lán)心小V不僅可以對(duì)屏幕界面進(jìn)行識(shí)別和操作,也可以通過(guò)接管音頻進(jìn)行自主對(duì)話,以完成用戶交代的任務(wù),例如幫助我們?nèi)ビ啿蛷d、訂咖啡等等。
“這是手機(jī)自動(dòng)化的一小步,卻是解放用戶雙手的一大步!敝車Q,未來(lái)PhoneGPT會(huì)帶來(lái)更多的應(yīng)用場(chǎng)景,更好的智能體驗(yàn),讓小V成為更懂你的私人助理。
藍(lán)心智能:用AI重構(gòu)系統(tǒng)體驗(yàn)
PhoneGPT背后,是來(lái)自于vivo全新的AI戰(zhàn)略——藍(lán)心智能。藍(lán)心智能是將大模型技術(shù)與手機(jī)操作系統(tǒng)深度融合的個(gè)人智能。周圍解釋,以藍(lán)心大模型為技術(shù)底座,藍(lán)心智能可以理解用戶的個(gè)人情景和偏好,為用戶提供個(gè)人化的專屬服務(wù); 同時(shí),藍(lán)心智能將全方位守護(hù)用戶的隱私安全; 通過(guò)系統(tǒng)深度融合,為用戶持續(xù)構(gòu)建更自然、符合直覺(jué)的交互,帶來(lái)更智能溫暖的體驗(yàn)。
為了達(dá)成這一點(diǎn),vivo從三個(gè)方面用AI重構(gòu)了系統(tǒng)體驗(yàn)。首先是重構(gòu)人與設(shè)備的交互體驗(yàn),讓交互更自然更符合直覺(jué)。在藍(lán)心大模型的加持下,手機(jī)將具備更強(qiáng)大的分析能力,多模態(tài)大模型都可以深度解讀你的意圖,進(jìn)而給你需要的反饋和服務(wù)。而依托文本大模型,讓藍(lán)心小V在文本能力外,進(jìn)一步具備強(qiáng)大的語(yǔ)音表征理解與生成能力,進(jìn)而讓手機(jī)能夠與人自然對(duì)話、翻譯語(yǔ)言、模擬人聲甚至理解對(duì)話中的情緒。
第二個(gè)方面是重構(gòu)人與數(shù)字世界的服務(wù)體驗(yàn),讓智能更加個(gè)人化,也就是構(gòu)建簡(jiǎn)單高效的服務(wù)獲取能力和主動(dòng)服務(wù)能力,讓人找服務(wù)的同時(shí),服務(wù)也主動(dòng)匹配人的需求。
第三個(gè)方面是重構(gòu)人與物理世界的連接體驗(yàn),讓溝通更順暢和溫暖。去年,vivo讀譜功能的發(fā)布,讓喜愛(ài)音樂(lè)的視障人士可以利用手機(jī)學(xué)習(xí)樂(lè)譜和樂(lè)器。而今,vivo利用多模態(tài)大模型,讓手機(jī)成為視障人士的眼睛,幫助他們跨越溝通的鴻溝。
藍(lán)心大模型矩陣:全面升級(jí)大模型能力
為進(jìn)一步夯實(shí)AI能力底座,vivo在今年的開發(fā)者大會(huì)上發(fā)布了全新自研藍(lán)心大模型矩陣。全面升級(jí)語(yǔ)言大模型和端側(cè)大模型能力,并帶來(lái)vivo自研的語(yǔ)音大模型、圖像大模型以及多模態(tài)大模型。這預(yù)示藍(lán)心智能,向著個(gè)人化和多元化發(fā)展邁出重要的一步。
在語(yǔ)言大模型上,千億級(jí)藍(lán)心云端大模型,重點(diǎn)優(yōu)化了意圖理解與分發(fā)和任務(wù)規(guī)劃能力。相比去年,整體能力提升30%,在SuperCLUE和C-EVAL榜單上繼續(xù)領(lǐng)跑國(guó)內(nèi)第一梯隊(duì)。
用戶的隱私安全始終是vivo打造藍(lán)心智能的首要原則,繼去年帶來(lái)了三款端側(cè)大模型之后,vivo正式發(fā)布全新30億參數(shù)量級(jí)的藍(lán)心端側(cè)大模型3B。在對(duì)話寫作、摘要總結(jié)、信息抽取等能力上,藍(lán)心3B可以越級(jí)比肩行業(yè)7B-9B模型。相比藍(lán)心7B,藍(lán)心 3B極致性能提升300%,平衡模式下功耗優(yōu)化達(dá)46%,極致出詞速度可以達(dá)到80字/s,系統(tǒng)功耗僅450mA,內(nèi)存占用僅1.4GB。在SuperCLUE和Equal Eval的小模型綜合能力評(píng)測(cè)中,藍(lán)心3B均排名第一,同時(shí)獲得了泰爾實(shí)驗(yàn)室端側(cè)大模型綜合能力認(rèn)證以及AIIA安全防范能力認(rèn)證。
除此之外,vivo還同步帶來(lái)了可以準(zhǔn)確理解自然語(yǔ)義,模擬人聲的全新自研藍(lán)心語(yǔ)音大模型、強(qiáng)化中國(guó)特色與東方美學(xué)的融合生成能力的藍(lán)心圖像大模型以及升級(jí)視覺(jué)感知理解能力的藍(lán)心多模態(tài)大模型。
周圍表示,藍(lán)心智能將以藍(lán)心大模型矩陣為技術(shù)底座,繼續(xù)探索AI與OS的深度融合,持續(xù)打造開放共贏的智能體生態(tài)。
未來(lái)已來(lái),AI手機(jī)正在改變我們與世界的連接方式,你準(zhǔn)備好迎接PhoneGPT時(shí)代了嗎?