4月29日上午,在GMIC2016(全球移動(dòng)互聯(lián)網(wǎng)大會(huì))上,百度開(kāi)放云事業(yè)部總經(jīng)理劉煬發(fā)表主題演講“云上的大數(shù)據(jù)與人工智能”,介紹了百度大數(shù)據(jù)和人工智能方面的研究成果,指出大數(shù)據(jù)、人工智能的發(fā)展應(yīng)用離不開(kāi)云計(jì)算強(qiáng)有力的支持,而大數(shù)據(jù)和人工智能的進(jìn)步也將拓展云計(jì)算應(yīng)用的深度和廣度, 同時(shí)劉煬表示未來(lái)將通過(guò)百度開(kāi)放云把大數(shù)據(jù)和人工智能技術(shù)能力開(kāi)放給行業(yè)和用戶(hù)使用,推動(dòng)相關(guān)技術(shù)的普及和應(yīng)用,推動(dòng)行業(yè)發(fā)展。
(百度云計(jì)算事業(yè)部總經(jīng)理劉煬)
云計(jì)算、大數(shù)據(jù)、人工智能已成為科技和互聯(lián)網(wǎng)行業(yè)發(fā)展的重點(diǎn)領(lǐng)域,作為技術(shù)驅(qū)動(dòng)型的百度在這些領(lǐng)域的表現(xiàn)也是亮點(diǎn)頻現(xiàn)。在美國(guó)麻省理工科技評(píng)論的2016年十大突破技術(shù)中,百度的語(yǔ)音接口技術(shù)上榜,成為唯一上榜的中國(guó)企業(yè)。劉煬介紹,借助百度的大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)打造的深度語(yǔ)音識(shí)別系統(tǒng),改變了傳統(tǒng)的語(yǔ)音識(shí)別模式,使語(yǔ)音接口變得更為實(shí)用和有效,人們可以更方便的與身邊的設(shè)備進(jìn)行互動(dòng)。而這只是百度在大數(shù)據(jù)、人工智能領(lǐng)域研究成果的一部分。
百度大數(shù)據(jù)廣泛應(yīng)用 人工智能成為技術(shù)核心
在大數(shù)據(jù)方面,劉煬表示百度大數(shù)據(jù)已突破技術(shù)積累期,廣泛應(yīng)用于百度外賣(mài)、百度地圖、百度金融等復(fù)雜業(yè)務(wù)場(chǎng)景中。在百度外賣(mài)業(yè)務(wù)中,大數(shù)據(jù)的應(yīng)用使百度外賣(mài)擁有業(yè)內(nèi)效率最高的騎士調(diào)度。基于大數(shù)據(jù),百度地圖可以實(shí)現(xiàn)更準(zhǔn)確的實(shí)時(shí)路況、擁堵預(yù)測(cè)、路徑規(guī)劃等功能,改善用戶(hù)出行體驗(yàn)。在互聯(lián)網(wǎng)金融領(lǐng)域,百度與國(guó)金證券聯(lián)合推出國(guó)內(nèi)首只大數(shù)據(jù)量化基金,通過(guò)大數(shù)據(jù)挖掘和智能化處理,實(shí)現(xiàn)描摹用戶(hù)畫(huà)像、精準(zhǔn)識(shí)別網(wǎng)民金融意圖、洞察股民情緒、預(yù)測(cè)行業(yè)市場(chǎng)走向等。
今年在世界互聯(lián)網(wǎng)大會(huì)上受到習(xí)主席關(guān)注的百度無(wú)人駕駛汽車(chē),本質(zhì)上也是人工智能技術(shù)綜合應(yīng)用。無(wú)人駕駛汽車(chē)包含高精地圖、語(yǔ)音識(shí)別、圖像識(shí)別、規(guī)劃行動(dòng)、分析決策、智能推薦等技術(shù)。這些都需要人工智能的應(yīng)用和支持。百度為研發(fā)無(wú)人車(chē)構(gòu)建了世界上最大規(guī)模的深度學(xué)習(xí)網(wǎng)絡(luò),擁有萬(wàn)億級(jí)的參數(shù)、千億級(jí)的樣本,目前規(guī)模仍在不斷擴(kuò)大。劉煬認(rèn)為深度學(xué)習(xí)的突破將會(huì)引領(lǐng)人工智能下一個(gè)大的浪潮。
而這些大數(shù)據(jù)和人工智能發(fā)展應(yīng)用的背后,是百度強(qiáng)大云計(jì)算能力的支撐。百度的深度語(yǔ)音識(shí)別系統(tǒng)每天語(yǔ)音識(shí)別和合成請(qǐng)求高達(dá)2.4億次,需要上千臺(tái)服務(wù)器,上千塊 GPU+FPGA;在精準(zhǔn)營(yíng)銷(xiāo)方面,基于百度大數(shù)據(jù)的全網(wǎng)精準(zhǔn)用戶(hù)畫(huà)像,需要上萬(wàn)臺(tái)服務(wù)器集群,每天需要處理數(shù)十PB數(shù)據(jù)量,具有上千萬(wàn)標(biāo)簽,并可以達(dá)到 85%以上的準(zhǔn)確率。
所以劉煬在演講中談到,大數(shù)據(jù)和人工智能對(duì)于計(jì)算的需求遠(yuǎn)超想象。百度的首席科學(xué)家吳恩達(dá)也說(shuō)過(guò)“深度學(xué)習(xí)這臺(tái)火箭,燃料為大數(shù)據(jù),而云計(jì)算則是引擎”。隨著百度將人工智能提升到公司級(jí)戰(zhàn)略定位,對(duì)于云計(jì)算的依賴(lài)和需求也將越來(lái)越多,百度也在不斷加大對(duì)于底層云技術(shù)的建設(shè)和支持。從底層的數(shù)據(jù)中心到計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和分布式系統(tǒng),百度均位于行業(yè)前列。
開(kāi)放云夯實(shí)底層黑科技 大數(shù)據(jù)、人工智能對(duì)外開(kāi)放
在數(shù)據(jù)中心領(lǐng)域,百度自建數(shù)據(jù)中心并支持模塊化建設(shè),大大提高了設(shè)計(jì)、實(shí)施速度。同時(shí)重視綠色節(jié)能,數(shù)據(jù)中心使用離線高壓直流電,做到99.5%的利用率,冷卻也實(shí)現(xiàn)自然冷鏈的工作。電源使用效率(PUE)達(dá)到1.22,位居國(guó)內(nèi)第一,并連續(xù)兩年獲得中國(guó)數(shù)據(jù)中心協(xié)會(huì)的最佳能源節(jié)能獎(jiǎng)。
在計(jì)算領(lǐng)域,百度擁有國(guó)內(nèi)規(guī)模最大深度學(xué)習(xí)異構(gòu)計(jì)算集群,同時(shí)也是整機(jī)柜方案的領(lǐng)導(dǎo)者,并聯(lián)合騰訊、阿里以及電信運(yùn)營(yíng)商等一起推動(dòng)整機(jī)柜的解決方案。在存儲(chǔ)領(lǐng)域使用高密度的存儲(chǔ),對(duì)于98%的磁盤(pán)故障可以事先報(bào)警,50%以上的磁盤(pán)故障可以自動(dòng)修復(fù),保障存儲(chǔ)安全。在網(wǎng)絡(luò)領(lǐng)域百度自研交換機(jī),全部支持萬(wàn)兆的網(wǎng)絡(luò)接入,數(shù)據(jù)中心內(nèi)網(wǎng)支持TB級(jí)的跨IDC的數(shù)據(jù)。
硬件層的規(guī)模和技術(shù)基礎(chǔ)之外,百度在分布式系統(tǒng)等軟件層的調(diào)度也處于業(yè)內(nèi)領(lǐng)先水平。劉煬指出,百度以網(wǎng)絡(luò)搜索業(yè)務(wù)起家,天生是一個(gè)大數(shù)據(jù)公司,承載數(shù)十款用戶(hù)量過(guò)億的產(chǎn)品和超百萬(wàn)企業(yè)客戶(hù),具有豐厚的技術(shù)積累和經(jīng)驗(yàn)。百度擁有Hadoop單集群1.5萬(wàn)臺(tái),并通過(guò)在/離線業(yè)務(wù)混合部署,全部數(shù)據(jù)中心的CPU利用率可以做到50%以上,遠(yuǎn)超業(yè)界同類(lèi)水平。為了支持百度開(kāi)放云、百度網(wǎng)盤(pán)和網(wǎng)頁(yè)搜索等產(chǎn)品,百度支持EB級(jí)別的對(duì)象存儲(chǔ)和EB級(jí)別的結(jié)構(gòu)化存儲(chǔ)。
最后,劉煬表示只有做好云計(jì)算基礎(chǔ)領(lǐng)域環(huán)節(jié)的工作,才能更好的支持人工智能、大數(shù)據(jù)等上層應(yīng)用的發(fā)展需求。同時(shí)百度也將通過(guò)百度開(kāi)放云釋放技術(shù)的力量,將人工智能、大數(shù)據(jù)以及其他優(yōu)秀的解決方案開(kāi)放給用戶(hù)和整個(gè)行業(yè),開(kāi)拓大家的想象力并幫助大家實(shí)現(xiàn)夢(mèng)想,推動(dòng)行業(yè)和社會(huì)的發(fā)展進(jìn)步。