AI 功能早已進(jìn)入手機(jī),比如拍攝優(yōu)化、面部識(shí)別、語(yǔ)音助手等。2024年被手機(jī)廠商宣稱為“AI手機(jī)元年”,主要是指AI大模型進(jìn)入手機(jī),可能引起交互與體驗(yàn)的變革,如語(yǔ)音交互能否取代觸屏,個(gè)人智能助理成為重要的用戶價(jià)值等。相應(yīng)地,手機(jī)操作系統(tǒng)、芯片、內(nèi)存等需升級(jí)換代,手機(jī)廠商認(rèn)為這將驅(qū)動(dòng)手機(jī)進(jìn)入繼功能機(jī)、智能手機(jī)之后的第三階段,AI手機(jī)階段。
對(duì)于消費(fèi)者來(lái)說(shuō),AI手機(jī)價(jià)值不在于硬件堆疊,而是基于AI大模型的應(yīng)用。IDC和OPPO聯(lián)合發(fā)布的《AI手機(jī)白皮書》提出“AI手機(jī)的用戶價(jià)值,是自在交互、智能隨心、專屬陪伴、安全可信的個(gè)人化助理。”實(shí)際上,大模型的出現(xiàn)(LLM為主),智能個(gè)人助理(Assistant)可以擴(kuò)展為更為自主的個(gè)人智能代理(Agent),深度參與到個(gè)人數(shù)據(jù)中,提供個(gè)性化服務(wù)。手機(jī)廠商2023年下半年起,逐步推出搭載大模型的手機(jī),標(biāo)配生成式AI應(yīng)用與個(gè)人Agent,但都還處于早期階段。本文基于個(gè)人AI Agent將成為個(gè)人智能應(yīng)用核心模式的判斷,從個(gè)人AI Agent核心組件及實(shí)現(xiàn)出發(fā),討論AI手機(jī)的現(xiàn)狀與未來(lái),以及運(yùn)營(yíng)商可為的布局。
個(gè)人AI Agent將成為智能應(yīng)用的核心模式,重塑終端與應(yīng)用生態(tài)
一是大模型具備增強(qiáng)智能助理擴(kuò)展性和可用性的潛力。Siri、谷歌助手、華為、百度的智能助手等早已進(jìn)入智能手機(jī)與智能家居,它們基于預(yù)定義的規(guī)則和較小的專用語(yǔ)言模型,執(zhí)行具體定向的任務(wù),如設(shè)定提醒、播放音樂(lè)、獲取天氣預(yù)報(bào)等,但擴(kuò)展性不足,對(duì)用戶意圖理解力也不夠。大模型(LLM為主)展現(xiàn)出很強(qiáng)的自然語(yǔ)言理解、內(nèi)容生成、邏輯推理等能力,以大模型驅(qū)動(dòng)的個(gè)人AI Agent,具備把目標(biāo)分解成子任務(wù),并調(diào)用工具來(lái)完成的潛力,預(yù)期可以做更泛化場(chǎng)景的任務(wù)。
二是APP與智能終端積累個(gè)人軌跡數(shù)據(jù),使行為智能成為可能。互聯(lián)網(wǎng)時(shí)代網(wǎng)站崛起,人類實(shí)現(xiàn)廣泛的信息共享交流,積累豐富的知識(shí)內(nèi)容,為大模型訓(xùn)練提供了內(nèi)容基礎(chǔ)。移動(dòng)互聯(lián)網(wǎng)時(shí)代,人類生活逐步線上化,即時(shí)通訊、購(gòu)物、健身、出行等APP匯聚用戶行為軌跡數(shù)據(jù),為個(gè)人行為預(yù)測(cè)訓(xùn)練提供了基礎(chǔ)。智能化時(shí)代,真正智能的個(gè)人Agent成為可能,從“幫你做事”到主動(dòng)預(yù)測(cè)“代你做事”(代理性程度不一),Agent有望成為智能時(shí)代的核心應(yīng)用載體,行為智能是本質(zhì)特點(diǎn)。
圖1 Agents可能成為個(gè)人智能應(yīng)用的核心載體
三是從個(gè)人AI Agent應(yīng)用模式出發(fā),會(huì)重構(gòu)智能終端與應(yīng)用生態(tài)。個(gè)人AI Agent的終極目標(biāo)是理解用戶并完成任務(wù),具備響應(yīng)性技能和主動(dòng)性技能(圖2)。即響應(yīng)用戶需求的能力,如問(wèn)題答復(fù)、天氣查詢等,與在用戶沒(méi)有明確命令的情況下,提供主動(dòng)服務(wù)的能力,如活動(dòng)推薦及執(zhí)行等。從應(yīng)用目標(biāo)出發(fā),個(gè)人AI Agent需要:(1)更廣泛的個(gè)人數(shù)據(jù)采集,包括來(lái)自APP等“軟終端”與各類傳感器、智能硬終端的信息監(jiān)測(cè);(2)用戶歷史記憶檔案與當(dāng)前狀態(tài)信息(環(huán)境、位置等)的組合,體現(xiàn)個(gè)性化、即時(shí)服務(wù)特點(diǎn);(3)多樣的工具調(diào)用能力,包括不同專業(yè)Agent的協(xié)同;(4)基礎(chǔ)AI模型是核心,連接調(diào)度Agent的功能組件。結(jié)合現(xiàn)有進(jìn)展,我們預(yù)計(jì)將會(huì)出現(xiàn):(1)新一波監(jiān)測(cè)類智能終端創(chuàng)新,類似Limitless錄音吊墜、Galaxy Ring運(yùn)動(dòng)睡眠等監(jiān)測(cè);(2)新一波智能Agent應(yīng)用創(chuàng)新,個(gè)人綜合Agent與專屬Agent(如健康助理)等;(3)新一波承載Agent應(yīng)用的終端創(chuàng)新,類似Rabbit R1、AI Pin、Ray-Ban Meta,當(dāng)然包括AI手機(jī);(4)新的操作系統(tǒng)內(nèi)核,大模型為核心,支持多工具、多Agent調(diào)用等;(5)個(gè)人隱私保護(hù)技術(shù)創(chuàng)新及應(yīng)用,加密與可信環(huán)境等。
圖2 個(gè)人AI Agent的主要組件
來(lái)源:《PERSONAL LLM AGENTS: INSIGHTS AND SURVEY ABOUT THE APABILITY, EFFICIENCY AND SECURITY》
現(xiàn)階段AI手機(jī)以生成式應(yīng)用為主,“行為智能”尚處探索階段
綜合當(dāng)前各方對(duì)AI手機(jī)的界定,AI手機(jī)可以概括為包含端側(cè)大模型、具備NPU的SoC芯片(IDC要求NPU性能在30到45 TOPS之間)、端側(cè)實(shí)現(xiàn)GenAI并向個(gè)人Agent發(fā)展等。下表是手機(jī)廠商目前推出的AI手機(jī)及特征總結(jié):
表3 主流廠商當(dāng)前AI手機(jī)推出情況
可以看出,現(xiàn)階段AI手機(jī)端側(cè)模型以7B為主流,并與云端協(xié)同,大模型開(kāi)始與操作系統(tǒng)融合。但受硬件與技術(shù)限制,AI手機(jī)應(yīng)用以內(nèi)容生成處理類場(chǎng)景為主,多是云端大模型應(yīng)用的移植,個(gè)人AI Agent尚未真正發(fā)揮“行為智能”的特點(diǎn),所以用戶感覺(jué)沒(méi)有明顯的差異化,不夠顛覆性。具體而言:
(1) 主打內(nèi)容生成處理,體現(xiàn)一定特色。以端側(cè)AI在圖像和文本處理的深化為主,如文本和圖片生成、AIGC 消除與背景補(bǔ)充、文件和本地通話摘要等。差異化來(lái)自某類場(chǎng)景的專注提升,如小米專注“影像”,VIVO文檔提煉更加高效等。
(2) 個(gè)人AI Agent處于探索階段。智能助手在識(shí)別用戶意圖,對(duì)手機(jī)的資源、性能、業(yè)務(wù)應(yīng)用進(jìn)行調(diào)度方面開(kāi)始探索,如:榮耀YOYO提供“任意門”功能,宣稱實(shí)現(xiàn)意圖識(shí)別、信息跨應(yīng)用跨設(shè)備流轉(zhuǎn),VIVO小V自然語(yǔ)言操控手機(jī)APP等。
(3) 注重跨終端融合與智能應(yīng)用生態(tài)打造。如小米“人車家全生態(tài)”布局,小愛(ài)能學(xué)習(xí)用戶的使用習(xí)慣,實(shí)現(xiàn)跨終端自動(dòng)控制。應(yīng)用生態(tài)方面,一是利用成熟生態(tài),如三星與Google的大模型及生態(tài)合作;二是建新生態(tài),如OPPO“1+N智能體生態(tài)”,即小布助手+開(kāi)發(fā)者和用戶Agents,榮耀發(fā)起“百模生態(tài)計(jì)劃”,手機(jī)端自有AI大模型為中控,調(diào)度云端模型生態(tài)等。
AI手機(jī)適應(yīng)新應(yīng)用模式的未來(lái)關(guān)鍵方向分析
新范式催生新終端形式,重構(gòu)應(yīng)用生態(tài),AI Pin是無(wú)屏幕交互Agent,Rabbit R1是直接操作APP的 Agent,Limitless的愿景也是個(gè)人 Agent,AI及Agent模式還會(huì)持續(xù)帶來(lái)智能眼鏡、耳機(jī)、家居等終端創(chuàng)新。面對(duì)原生AI終端與AI應(yīng)用,AI化的手機(jī)的定位及形態(tài)面臨升級(jí),或需重新定義的局面。具體來(lái)說(shuō),有以下幾個(gè)值得關(guān)注的問(wèn)題和方向:
(1) AI手機(jī)還能否整合AI終端保持中心設(shè)備的位置:本質(zhì)上就是AI手機(jī)能否成為個(gè)人AI Agent的集成調(diào)度中心,AI終端成為手機(jī)的補(bǔ)充,或者作為新的功能組件的問(wèn)題。目前專項(xiàng)AI硬件,如Limitless吊墜、Ploud錄音機(jī),包括主打音頻和拍攝的Ray-Ban Meta初步獲得市場(chǎng)認(rèn)可,也與手機(jī)配合,而偏綜合的,甚至宣稱取代手機(jī)的AI Pin、Rabbit R1低于預(yù)期,高開(kāi)低走。AI手機(jī)成為個(gè)人AI Agent的集成調(diào)度中心,核心優(yōu)勢(shì)是本地算力和存儲(chǔ),能夠承載端側(cè)模型和個(gè)人隱私數(shù)據(jù),是當(dāng)下的最佳載體。未來(lái)不排除某類更隨身輕靈的AI原生穿戴設(shè)備,借助云端+網(wǎng)絡(luò)+可信數(shù)據(jù)空間等成為新中心,產(chǎn)生更移動(dòng)化場(chǎng)景的Agent應(yīng)用生態(tài)。
(2) 行為數(shù)據(jù)孤島下如何協(xié)調(diào)建立用戶的個(gè)人記憶:用戶行為軌跡數(shù)據(jù)分散終端及在各大APP中,后者未必愿意開(kāi)放API。探索的方向是:①Agent學(xué)習(xí)APP操作方法,通過(guò)UI界面模擬完成任務(wù),如Rabbit R1,以及APPAgent框架等,但不是最有效率的方案;②系統(tǒng)級(jí)個(gè)人Agent、專項(xiàng)Agent(如購(gòu)物、旅游)之間協(xié)同調(diào)用,彌補(bǔ)數(shù)據(jù)孤島劣勢(shì);③大廠廣泛布局智能終端,構(gòu)建用戶記憶檔案,比如小米、蘋果、華為、三星等向智能可穿戴、智能家居擴(kuò)展等。
(3) 手機(jī)廠商APP Store能否升級(jí)為“Agent” Store:APP Store是手機(jī)廠商的重要營(yíng)收渠道,引入Agent面臨:①大模型不是手機(jī)廠商包括蘋果的強(qiáng)項(xiàng),主導(dǎo)權(quán)在Open AI 、Google等手中;② Agent模式向下擠壓原APP,甚至跳過(guò)APP,利益鏈條被打破;③Agent Store需要新的平臺(tái)插件、功能組件與商業(yè)模式等?赡艿姆较颍阂皇墙⒋竽P蜕鷳B(tài),如榮耀“百模生態(tài)計(jì)劃”以及蘋果尋求多方合作;二是探索新商業(yè)模式,如系統(tǒng)級(jí)Agent、專項(xiàng)Agent及APP數(shù)據(jù)交換與協(xié)同合作,平臺(tái)架構(gòu)設(shè)立面向B端的Agent組合調(diào)用層,按量/訂閱收費(fèi)分成等;三是建立或參與建立數(shù)據(jù)集成平臺(tái)(如可信數(shù)據(jù)空間),匯集用戶行為數(shù)據(jù),統(tǒng)一格式與隱私管理,為Agent提供開(kāi)發(fā)運(yùn)營(yíng)基礎(chǔ)等。
(4) 個(gè)人數(shù)據(jù)安全如何有效保障:在AI手機(jī)等本地端保存處理,被認(rèn)為是最安全的方式,但對(duì)內(nèi)存挑戰(zhàn)大,推理成本也比較高。云邊協(xié)作是另一種處理方式,隱私保護(hù)技術(shù)主要是數(shù)據(jù)屏蔽、數(shù)據(jù)加密、可信執(zhí)行環(huán)境等?偟膩(lái)說(shuō),現(xiàn)有隱私保護(hù)技術(shù)還不足以支持高水平個(gè)人AI Agent運(yùn)作,需要手機(jī)廠商等提出創(chuàng)新性解決方案,贏得用戶信任。
(5) AI手機(jī)軟硬件持續(xù)升級(jí):一是端側(cè)模型及OS效率改進(jìn),蘋果OpenELM 、微軟Phi-3、Octopus V2等端側(cè)模型在語(yǔ)⾔、推理、編碼等方面有良好表現(xiàn),蘋果即將發(fā)布的iOS 18是其展開(kāi)AI競(jìng)爭(zhēng)的主要平臺(tái);二是端側(cè)硬件持續(xù)升級(jí),將采用3nm等更先進(jìn)制程,推理能力及手機(jī)內(nèi)存加速提升等。
運(yùn)營(yíng)商可以做什么布局
面對(duì)AI終端與應(yīng)用模式變革趨勢(shì),電信運(yùn)營(yíng)商一是可把握新一波AI終端云端聯(lián)網(wǎng)的流量需求,帶動(dòng)流量卡號(hào)銷售;二是優(yōu)化網(wǎng)絡(luò)質(zhì)量與套餐服務(wù),Agent端云實(shí)時(shí)的數(shù)據(jù)處理交互,對(duì)網(wǎng)絡(luò)速度和穩(wěn)定性的需求增加,因個(gè)人數(shù)據(jù)更加完整,運(yùn)營(yíng)商可以與應(yīng)用方合作,提供個(gè)性化的套餐服務(wù);三是布局個(gè)人、家庭Agent特色智能服務(wù),如健康管理服務(wù)、智能家庭服務(wù)、緊急響應(yīng)服務(wù)等;四是參與用戶數(shù)據(jù)隱私保護(hù)技術(shù)開(kāi)發(fā)與可信數(shù)據(jù)空間建設(shè),提供加密技術(shù)保護(hù)用戶Agent數(shù)據(jù),積極布局個(gè)人、家庭可信數(shù)據(jù)空間基礎(chǔ)設(shè)施建設(shè)等。