每經(jīng)記者 查道坤 每經(jīng)編輯 宋思艱 實(shí)習(xí)編輯 陳適
只要你開口,它就能將你的聲音轉(zhuǎn)化成文字;只要你會(huì)說一口“二級(jí)乙等”的普通話,它的轉(zhuǎn)寫準(zhǔn)確率就可以達(dá)到90%以上。它有一個(gè)小目標(biāo),讓人工智能今年在全球首次通過國家執(zhí)業(yè)醫(yī)師資格考試,成為“全科醫(yī)生”;它有一個(gè)大目標(biāo),在2029年的“而立之年”,成為全球人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者。
這樣的技術(shù)、這樣的愿景,來自一家名為科大訊飛的公司。近日,在它十八周年成人禮之際,《每日經(jīng)濟(jì)新聞》記者專訪了公司董事長劉慶峰——他的公司明年上半年員工總數(shù)將逾萬人,而1999年成立時(shí),連他在內(nèi)只有“十八羅漢”。
●說成果:9年兩獲“國家科技進(jìn)步獎(jiǎng)”
NBD:自1999年發(fā)展至今,科大訊飛已成為國內(nèi)語音產(chǎn)業(yè)龍頭企業(yè),目前公司在語音產(chǎn)業(yè)領(lǐng)先地位如何體現(xiàn)?
劉慶峰:科大訊飛是我國唯一以語音技術(shù)為產(chǎn)業(yè)化方向的“國家863計(jì)劃成果產(chǎn)業(yè)化基地”、“國家規(guī)劃布局內(nèi)重點(diǎn)軟件企業(yè)”、“國家高技術(shù)產(chǎn)業(yè)化示范工程”,并被原信息產(chǎn)業(yè)部確定為中文語音交互技術(shù)標(biāo)準(zhǔn)工作組組長單位,牽頭制定中文語音技術(shù)標(biāo)準(zhǔn)!皣抑悄苷Z音高新技術(shù)產(chǎn)業(yè)化基地”、“語音及語言信息處理國家工程實(shí)驗(yàn)室”先后落戶公司,有利于進(jìn)一步匯聚資源,提升科大訊飛產(chǎn)業(yè)龍頭地位。
2003年、2011年,科大訊飛兩次榮獲“國家科技進(jìn)步獎(jiǎng)”,2005年、2011年兩次獲得中國信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽(yù)“信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎(jiǎng)”。自90年代中期以來,在歷次國內(nèi)外語音合成評(píng)測(cè)中,各項(xiàng)關(guān)鍵指標(biāo)均名列第一。2017年8月,在國際醫(yī)學(xué)影像領(lǐng)域的權(quán)威評(píng)測(cè)LUNA上,科大訊飛獲得平均召回率92.3%的檢測(cè)效果,以顯著優(yōu)勢(shì)獲得該項(xiàng)評(píng)測(cè)的第一名并刷新世界紀(jì)錄。
基于擁有自主知識(shí)產(chǎn)權(quán)的世界領(lǐng)先智能語音和人工智能技術(shù),科大訊飛已推出從大型電信級(jí)應(yīng)用到小型嵌入式應(yīng)用、從教育到電信等行業(yè)、從手機(jī)到車載設(shè)備、從家電到玩具等,能夠滿足不同應(yīng)用環(huán)境下企業(yè)和個(gè)人用戶需求的多種產(chǎn)品。科大訊飛已占有中文語音技術(shù)市場(chǎng)70%以上市場(chǎng)份額。
NBD:科大訊飛從1999年幾個(gè)大學(xué)生創(chuàng)業(yè),到今天在IBM、微軟、谷歌等巨頭環(huán)視的情況下占中國語音交互市場(chǎng)70%的份額,更在全球與這些企業(yè)進(jìn)行競(jìng)爭(zhēng),在這些年的發(fā)展與競(jìng)爭(zhēng)中訊飛具體做了什么?
劉慶峰:1999年我們剛創(chuàng)業(yè)的時(shí)候,外界很多人在問訊飛18人的團(tuán)隊(duì),憑什么有機(jī)會(huì)成功?2008年,我們成為中國語音領(lǐng)域第一家上市公司。2012年,我們做成了業(yè)界公認(rèn)的中文語音產(chǎn)業(yè)第一,成為中國語音產(chǎn)業(yè)聯(lián)盟的理事長。
之所以能走到今天,首先,訊飛將核心技術(shù)做到了世界領(lǐng)先,多次獲得國家級(jí)和世界級(jí)獎(jiǎng)項(xiàng)。其次,“AI+應(yīng)用”全面開花,F(xiàn)在,通過學(xué)習(xí),我們“人工智能+醫(yī)療”在有些科目上已經(jīng)接近一線醫(yī)生的水平。我們跟中國醫(yī)學(xué)科學(xué)院協(xié)和醫(yī)學(xué)院簽訂戰(zhàn)略合作,不光是共建醫(yī)學(xué)人工智能中心,我們的目標(biāo)是還要讓人工智能今年能在全球首次通過國家執(zhí)業(yè)醫(yī)師資格考試。訊飛“全科醫(yī)生”這個(gè)項(xiàng)目,不光是對(duì)中國,對(duì)全世界都將是一個(gè)巨大的福音。
NBD:科大訊飛的語音合成技術(shù)早已被公認(rèn)處于業(yè)界領(lǐng)先水平,在語音識(shí)別方面,科大訊飛有哪些競(jìng)爭(zhēng)優(yōu)勢(shì)?
劉慶峰:2008年至今,科大訊飛連續(xù)在國際說話人、語種識(shí)別評(píng)測(cè)大賽中名列前茅。2016年,科大訊飛取得國際語音識(shí)別大賽(CHiME)全部指標(biāo)第一。該項(xiàng)技術(shù)也深刻應(yīng)用到產(chǎn)品中,比如“訊飛聽見”!坝嶏w聽見”智能會(huì)議系統(tǒng)能實(shí)時(shí)將說話者的發(fā)言一字不落地完整同步到屏幕上,實(shí)時(shí)對(duì)發(fā)言者發(fā)言進(jìn)行轉(zhuǎn)寫,同時(shí),支持完整記錄、語氣詞過濾、語句順滑、文本在線修改、會(huì)議結(jié)束即時(shí)出稿,轉(zhuǎn)寫準(zhǔn)確率可達(dá)95%以上。
“訊飛聽見”智能會(huì)議系統(tǒng)是全球首款中文語音實(shí)時(shí)轉(zhuǎn)寫和多語種實(shí)時(shí)翻譯系統(tǒng)。該系統(tǒng)具有三大特點(diǎn):一是實(shí)時(shí),不僅可以將發(fā)言轉(zhuǎn)換成文字,且同時(shí)能將文字再同步翻譯成英日韓等四種語言,當(dāng)演講或會(huì)議結(jié)束時(shí)就可以直接導(dǎo)出多語種文本;二是準(zhǔn)確率高,對(duì)二乙水平的普通話,轉(zhuǎn)寫準(zhǔn)確率可達(dá)90%以上;三是離線轉(zhuǎn)寫,采用本地部署服務(wù)器,確保數(shù)據(jù)安全。這些都是科大訊飛在語音識(shí)別方面的優(yōu)勢(shì)所在。
●談行業(yè):人工智能產(chǎn)業(yè)進(jìn)入窗口期
NBD:今年以來,人工智能產(chǎn)業(yè)非;馃,包括訊飛在內(nèi)的不少業(yè)內(nèi)人士都認(rèn)為現(xiàn)在是人工智能爆發(fā)前夜。但人工智能已有幾十年的發(fā)展歷史,憑什么確認(rèn)這次的時(shí)機(jī)就一定成熟?
劉慶峰:2016年底,科大訊飛首先在發(fā)布會(huì)上提出,我們已經(jīng)從“互聯(lián)網(wǎng)+”時(shí)代進(jìn)入到“人工智能+”時(shí)代?梢哉f,在科大訊飛的努力下,2016年成了中國人工智能元年。目前,全球人工智能產(chǎn)業(yè)已經(jīng)進(jìn)入一個(gè)關(guān)鍵的窗口期。今年7月20日,國務(wù)院《新一代人工智能發(fā)展規(guī)劃》正式發(fā)布,在我們國家的這一人工智能產(chǎn)業(yè)規(guī)劃中,對(duì)相關(guān)核心技術(shù)、源頭項(xiàng)目推動(dòng)、智能產(chǎn)業(yè)發(fā)展、智能經(jīng)濟(jì)等都進(jìn)行了清晰描述?梢赃@么說,未來3~5年是人工智能最關(guān)鍵的格局確定窗口期。在這3~5年,誰能讓人工智能應(yīng)用真正形成規(guī)模、讓應(yīng)用落地,誰就能在未來智能產(chǎn)業(yè)中占領(lǐng)先機(jī)。
人工智能的核心技術(shù)發(fā)展有兩條主線:第一是以深度神經(jīng)網(wǎng)絡(luò)為代表的算法,在這方面科大訊飛已處于全球領(lǐng)先水平,并且在多項(xiàng)國際比賽中拿到全球第一;第二是腦科學(xué)和類腦科學(xué)研究。目前腦科學(xué)和類腦科學(xué)相關(guān)研究不斷突破,在這個(gè)領(lǐng)域,我們已經(jīng)與中國醫(yī)學(xué)科學(xué)院、協(xié)和醫(yī)學(xué)院、中國科學(xué)院神經(jīng)所等眾多研究機(jī)構(gòu)進(jìn)行了深度合作。
在上述兩個(gè)方向上,科大訊飛都在持續(xù)突破。即使沒有新的算法突破,以我們今天所掌握的技術(shù)成果,結(jié)合云計(jì)算、大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng),我們也已經(jīng)可以改變一個(gè)又一個(gè)的行業(yè)。當(dāng)前,我們已經(jīng)可以讓機(jī)器學(xué)習(xí)行業(yè)最頂尖專家的知識(shí),未來達(dá)到行業(yè)一流專家水平,從而超越90%的普通專業(yè)人士,這就是今天我們面臨的機(jī)遇。
NBD:科大訊飛目前的主要優(yōu)勢(shì)是語音識(shí)別領(lǐng)域,公司未來還有沒有其他人工智能領(lǐng)域的計(jì)劃?
劉慶峰:科大訊飛在語音合成、語音識(shí)別、口語評(píng)測(cè)、語言翻譯、聲紋識(shí)別、人臉識(shí)別、自然語言處理等智能語音與人工智能核心技術(shù)上代表著國際最高水平。
2014年,隨著人工智能時(shí)代的到來,科大訊飛推出“訊飛超腦計(jì)劃”,目標(biāo)是讓機(jī)器不僅“能聽會(huì)說”,還要“能理解會(huì)思考”,從而實(shí)現(xiàn)一個(gè)中文認(rèn)知智能計(jì)算引擎,未來將引領(lǐng)在家居、教育、客服、醫(yī)療等領(lǐng)域的智能應(yīng)用。
2015年,科大訊飛重新定義了萬物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn),發(fā)布了對(duì)人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI。
2016年,圍繞科大訊飛人工智能開放平臺(tái)的使用人次與創(chuàng)業(yè)團(tuán)隊(duì)成倍增長,帶動(dòng)超百萬人進(jìn)行雙創(chuàng)活動(dòng)。截至2017年6月,訊飛開放平臺(tái)第三方的開發(fā)團(tuán)隊(duì)達(dá)到37.3萬,每天的請(qǐng)求數(shù)達(dá)到37億次,累計(jì)終端數(shù)達(dá)到14.7億個(gè),以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)正在持續(xù)構(gòu)建?拼笥嶏w在智能語音、人工智能核心研究和產(chǎn)業(yè)化方面的突出成績,得到社會(huì)各界和國內(nèi)外一致認(rèn)可,作為“中國人工智能國家隊(duì)”已經(jīng)形成共識(shí)。
●論前景:教育、醫(yī)療、司法等領(lǐng)域是主賽道
NBD:今年人工智能概念快速熱起來,你怎么看待這種現(xiàn)象?有沒有擔(dān)心這種火熱對(duì)人工智能技術(shù)的發(fā)展帶來負(fù)面影響?
劉慶峰:此前有觀點(diǎn)認(rèn)為,同聲傳譯將被人工智能取代,這其實(shí)是對(duì)新技術(shù)發(fā)展的高度神化,可能會(huì)對(duì)大眾造成錯(cuò)誤引導(dǎo),不利于產(chǎn)業(yè)生態(tài)持續(xù)健康發(fā)展,F(xiàn)階段,人工智能技術(shù)發(fā)展不需要“被神化”,技術(shù)發(fā)展乃至產(chǎn)品化有其自身發(fā)展的曲線,從技術(shù)走向市場(chǎng),一定是在不斷完善的過程中走向成熟。
目前,機(jī)器翻譯已經(jīng)取得非常大的進(jìn)步,在衣食住行等常用生活用語上的中英翻譯可以達(dá)到大學(xué)六級(jí)的水平,能夠幫助人們?cè)谝恍﹫?chǎng)景中處理語言交流的問題,但距離會(huì)議同傳以及高水平翻譯所講究的“信、達(dá)、雅”還存在很大的差距。
訊飛一直所努力的,是希望通過語音轉(zhuǎn)寫和翻譯技術(shù)幫助同傳提高工作效率、減少失誤,形成人機(jī)耦合的同傳新模式,而非替代同聲傳譯。
目前,人工智能技術(shù)的發(fā)展在感知智能和認(rèn)知智能領(lǐng)域都取得了長足進(jìn)步,在語音交互、智能評(píng)測(cè)、口語翻譯等方面更是有突破性建樹。
NBD:科大訊飛目前已經(jīng)把相關(guān)技術(shù)應(yīng)用到教育、醫(yī)療、司法等等領(lǐng)域,選擇進(jìn)入行業(yè)的標(biāo)準(zhǔn)有哪些?目前,同樣做人工智能的公司有很多,但一些人似乎很難獲得切入到行業(yè)場(chǎng)景的能力,科大訊飛在這方面有哪些經(jīng)驗(yàn)?
劉慶峰:在這個(gè)時(shí)代,人工智能不再是概念,應(yīng)用是硬道理。人工智能改變世界的過程,需要在一個(gè)又一個(gè)的領(lǐng)域來進(jìn)行應(yīng)用的創(chuàng)新,通過與領(lǐng)域?qū)<业慕Y(jié)合來獲得行業(yè)的數(shù)據(jù)。這決定了人工智能產(chǎn)業(yè)不是一家公司可以包打天下的,必須建立產(chǎn)業(yè)生態(tài)。產(chǎn)業(yè)生態(tài)的好壞,建設(shè)的快慢,決定了一個(gè)企業(yè)或者一個(gè)國家的人工智能產(chǎn)業(yè)發(fā)展進(jìn)程。所以,在人工智能領(lǐng)域,不是一個(gè)人跟另一個(gè)人的戰(zhàn)斗,也不是單個(gè)企業(yè)與單個(gè)企業(yè)之間的戰(zhàn)斗,而是一個(gè)體系和另一個(gè)體系、一個(gè)生態(tài)和另一個(gè)生態(tài)的競(jìng)爭(zhēng)。
科大訊飛現(xiàn)在也確定了自己的生態(tài)體系框架:第一層是圍繞訊飛超腦,各事業(yè)群、事業(yè)部主導(dǎo)的方向,這構(gòu)成了我們的核心層,也是核心業(yè)務(wù)構(gòu)成;第二層是一些探索性方向;第三層則是更大范圍下,圍繞科大訊飛核心技術(shù)的產(chǎn)業(yè)生態(tài)。我們會(huì)按照這個(gè)生態(tài)的道路不斷向前推進(jìn)。
NBD:目前包括百度等互聯(lián)網(wǎng)公司也在做人工智能研究,并且部分板塊和科大訊飛有重合,你如何看待這種競(jìng)爭(zhēng)?科大訊飛有哪些優(yōu)勢(shì)?
劉慶峰:確實(shí)現(xiàn)在非常多的優(yōu)秀公司都在做人工智能,每家公司有自己的特點(diǎn),我們的優(yōu)勢(shì)是把我們最好的算法跟行業(yè)專家和行業(yè)數(shù)據(jù)結(jié)合,其他公司做人臉識(shí)別、視頻識(shí)別,他們也都有自己擅長的領(lǐng)域,賽道各不相同。訊飛會(huì)把核心能力平臺(tái)化地對(duì)外提供,我們選的主賽道有教育、醫(yī)療、司法、車載、客服這些領(lǐng)域,在這些領(lǐng)域,我們可以看到一個(gè)非常大的未來,而且我們可以占據(jù)很好的空間。
NBD:科大訊飛未來的戰(zhàn)略的是什么?
劉慶峰:今年是科大訊飛成立十八周年,到2029年也就是科大訊飛成立三十周年。從“成人禮”到“三十而立”,2029年,每一個(gè)設(shè)備都將能聽會(huì)說,人工智能將像水和電一樣無所不在。2029年,訊飛將會(huì)怎樣?我們的愿景是成為中國人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者和產(chǎn)業(yè)生態(tài)構(gòu)建者,成為全球人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者,成為一家用人工智能改變世界的偉大企業(yè)。