根據(jù)美國商標(biāo)和專利局(USPTO)近日公示的清單,微軟攜手 OpenAI 構(gòu)想了一個(gè)聲音識(shí)別 AI 技術(shù)專利,不僅能夠識(shí)別門鈴、狗叫或嬰兒啼哭等日常聲音,還能檢測地震和風(fēng)暴等自然災(zāi)害的跡象。
微軟構(gòu)想的該系統(tǒng)通過處理環(huán)境聲音,可以提醒用戶注意潛在的危險(xiǎn),可以在公共安全、備災(zāi)工作發(fā)揮重要作用。
微軟這項(xiàng)聲音 AI 專利的核心在于對(duì)音頻信號(hào)的復(fù)雜處理。
系統(tǒng)首先將聲音信號(hào)分解成較小的片段,在經(jīng)過獨(dú)立處理之后創(chuàng)建聲音在時(shí)域中的規(guī)范化表示,本質(zhì)上是聲音在時(shí)間軸上的映射。
然后該系統(tǒng)映射數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),進(jìn)一步匹配和評(píng)估聲音片段,識(shí)別出的每一類聲音事件的分配得分(assigning scores)和發(fā)生概率。
系統(tǒng)再調(diào)用算法進(jìn)行后期處理之后,完善這些分?jǐn)?shù)和概率,為每種聲音類型生成置信度值(confidence values)。這一細(xì)致的過程使人工智能能夠準(zhǔn)確識(shí)別從普通到潛在危險(xiǎn)的各種聲音。