12 月 19 日消息,據“新一代人工智能聯(lián)盟”公眾號消息,2023 年 12 月 7 日,中關村視聽產業(yè)技術創(chuàng)新聯(lián)盟批準發(fā)布《信息技術 虛擬現實內容表達 音頻》(標準號 T / AI 125-2023)團體標準。起草單位包括:
清華大學、北京理工大學、中國電子技術標準化研究院、北京字跳網絡技術有限公司、賽因芯微(北京)電子科技有限公司、北京全景聲信息科技有限公司、清華大學天津電子信息研究院、北京大學、咪咕文化科技有限公司、騰訊科技(深圳)有限公司、北京愛奇藝科技有限公司、小米通訊技術有限公司、全景聲(北京)智能科技有限公司、華為技術有限公司、中國傳媒大學。
據介紹,AVS VR 音頻團體標準《信息技術 虛擬現實內容表達 音頻》的正式制定起始于 2016 年 6 月舉行的工作組第 57 次會議,AVS 音頻組輸出“AVS 虛擬現實音頻技術方案征集書 V1.0”,啟動虛擬現實中沉浸式音頻編解碼及渲染技術的征集工作。
2020 年 4 月 7 日,經新一代人工智能產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟和中關村視聽產業(yè)技術創(chuàng)新聯(lián)盟標準工作組聯(lián)合審議決定立項 AVS VR 音頻團體標準。
AVS VR 音頻團體標準歷經工作組正式和臨時加會議 41 次,共收到 VR 音頻相關提案 115 項,被采納的技術提案 39 項,于 2022 年 11 月 25 日形成 AVS VR 音頻團標 FCD。
2023 年 1 月 6 日 AVS VR 音頻完成團標征求意見稿的組內公示后,形成了送審稿,并在 2023 年 10 月 26 日通過了全國信標委多媒體分委會的審查,終于 2023 年 12 月 7 日形成團體標準正式發(fā)布。
AVS VR 音頻標準描述了虛擬現實音頻表達所需要的元數據、渲染器及面向傳輸的數據流方式,支持 3DOF 和 6DOF 等虛擬現實場景下所需要的技術功能,涉及基于聲道、對象、場景三類信號的采集制作和渲染回放等相關技術描述。AVS VR 音頻標準中采納的所有技術均依據 VR 音頻測試方案進行了第三方測試驗證,包括規(guī)范性驗證,功能性驗證和渲染效果主觀測試,并在實際系統(tǒng)中進行了系統(tǒng)驗證。
標準中的相應技術在各大賽事、活動中也早有應用。2022 年 9 月中央廣播電視總臺“云聽”客戶端使用 AVS VR 音頻標準中的耳機渲染技術完成 CCTV 中秋晚會現場直播;2022 年 11 月世界杯央視轉播演示系統(tǒng)使用了 AVS VR 音頻標準中的揚聲器渲染技術進行監(jiān)聽,從制作端生成元數據下發(fā),并按制作者意圖生成實時、動態(tài)元數據下發(fā),實現了制作、監(jiān)聽與下發(fā)數據的完整流程。同時,AVS VR 音頻雙耳渲染技術還在 VR 頭顯設備中基于 Unity3D 軟件平臺進行了 3DOF 和 6DOF 下的主觀聽音測試驗證。
AVS VR 音頻標準在遵循 ITU-R BS.2076-2 規(guī)范的前提下,面向適應我國全景音頻播出、沉浸式音頻通信、虛擬現實音頻交互等領域,提供虛擬現實音頻內容的元素定義、編碼規(guī)范和渲染重建建議,服務于虛擬現實(VR / AR / MR / XR)設備和相關系統(tǒng)中的音頻應用。
結合國內虛擬現實音頻產業(yè)發(fā)展的實際情況,按照 AVS 工作組的標準制訂流程和 AVS 音頻組工作規(guī)范,在 AVS 音頻組的組織下,依照技術需求,審議技術提案、制定測試方案、進行測試和評比,采納滿足技術需求且性能更優(yōu)的技術提案,構建標準技術的基礎架構,通過標準文本編輯、參考軟件驗證形成標準草案。該標準填補了國內虛擬現實音頻技術標準的空白,并爭取為相關國際標準的制定發(fā)揮關鍵作用。
該標準將首先作為 AVS 團體標準發(fā)布,并申請成為國家標準和 IEEE 國際標準發(fā)布。
IT之家注:新一代人工智能產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)由兩百余家來自人工智能行業(yè)內的企業(yè)、高校和科研院所、資本機構、服務機構、創(chuàng)新創(chuàng)業(yè)企業(yè)組成。