新聞中心

EEPW首頁 > 業(yè)界動態(tài) > 騰訊多媒體實驗室:以提升用戶體驗為目的,構(gòu)建音視頻質(zhì)量評估體系

騰訊多媒體實驗室:以提升用戶體驗為目的,構(gòu)建音視頻質(zhì)量評估體系

作者: 時間:2019-11-13 來源:騰訊科技 收藏

近日,首屆Techo開發(fā)者大會在北京召開,在及通信分論壇上,專家研究員王海強發(fā)表了題為《視頻業(yè)務中的主客觀質(zhì)量評估》的演講,在當前發(fā)展風口下,介紹了視頻質(zhì)量評估的主客觀方法、應用場景,并提出了建立在算法基礎(chǔ)上的主客觀視頻質(zhì)量評測平臺及其在業(yè)務線中的應用。

本文引用地址:http://www.2s4d.com/article/201911/407003.htm

Techo開發(fā)者大會是由云發(fā)起的面向全球開發(fā)者和技術(shù)愛好者的年度盛會,作為一個專注于前沿技術(shù)研討的非商業(yè)大會,大會致力于開發(fā)者的能力成長和實踐創(chuàng)新,旨在通過匯聚全球頂尖行業(yè)專家和技術(shù)愛好者,搭建一個開放、中立、活躍的技術(shù)交流平臺。本屆Techo大會邀請了海內(nèi)外150位行業(yè)專家圍繞前沿技術(shù)發(fā)展進行解讀,聚集了5000名開發(fā)者參與技術(shù)交流和探討。

視聽時代,應用越來越廣泛:直播、短視頻,視頻節(jié)目、音視頻通話……在萬物訴諸音視頻的互聯(lián)網(wǎng)時代,用戶對音視頻質(zhì)量訴求也愈加強烈。為提高音畫質(zhì)量,基礎(chǔ)性工程便是建立行業(yè)評估體系,用評測標準對音視頻技術(shù)和產(chǎn)品進行“打分”。然而,目前音視頻質(zhì)量評估領(lǐng)域仍存在門檻成本較高、主觀觀感存在偏差等難題。

王海強在演講中介紹了主客觀質(zhì)量評估方法,普及了兩者在PGC/UGC業(yè)務中的應用,并針對評估標準這一終極準則問題,介紹了的自研算法和解決方案。

據(jù)王海強介紹,目前視頻質(zhì)量評估方法分為兩大類:客觀質(zhì)量評估與主觀質(zhì)量評估。前者計算視頻的質(zhì)量分數(shù),又根據(jù)是否使用高清視頻做參考、視頻質(zhì)量是否與失真程度成單調(diào)關(guān)系等進一步細分;后者依賴人眼觀看并打分,能夠直觀反映觀眾對視頻質(zhì)量的感受。

目前,視頻質(zhì)量評測標準并不統(tǒng)一,常規(guī)做法是使用開源模型VMAF來做PGC視頻的質(zhì)量把控,而對UGC視頻,只能依賴于開發(fā)人員觀看視頻來定位、解決質(zhì)量問題。王海強認為,視頻質(zhì)量評估的目標是“致力于評估視頻的人眼感知質(zhì)量”,即通過通用的、準確的、公平的測試能力與測試方法論,盡可能選擇最可靠的技術(shù)方案,以客觀與主觀評測相結(jié)合的方式,達到最接近人眼感知的質(zhì)量效果。

然而,主觀測試極其耗費人力和時間,整體效率較低,把所有質(zhì)量問題都訴諸于主觀測試是不現(xiàn)實的。與其完全追求主觀測試的完美性,不如以“主觀質(zhì)量”為目的,通過基于深度學習的客觀音視頻質(zhì)量評估算法,進行端到端的音視頻質(zhì)量評估,從而逼近人眼觀看的體驗效果。

對此,王海強介紹了的質(zhì)量評估解決方案:一是結(jié)合業(yè)務需求,使用“在線主觀質(zhì)量評測平臺”,來構(gòu)建大規(guī)模主觀質(zhì)量數(shù)據(jù)庫;二是使用所收集的主觀數(shù)據(jù)來訓練基于深度學習的客觀質(zhì)量評估算法;三是部署訓練好的質(zhì)量評估算法到業(yè)務線中,閉環(huán)監(jiān)控可能存在的質(zhì)量問題。從以上三角度出發(fā),音視頻質(zhì)量評估能夠在兼顧不同業(yè)務、場景的前提下,滿足效率與精度兩大需求。

多媒體實驗室:以用戶體驗為最終目的

王海強所介紹的“在線主觀質(zhì)量評測平臺”,便是騰訊多媒體實驗室在音視頻評估領(lǐng)域的落地產(chǎn)品——騰訊多媒體實驗室視頻質(zhì)量評測平臺。目前,這一平臺不僅能夠完成基于人眼的視頻質(zhì)量評測,模擬人耳的音頻質(zhì)量評測,還能夠在音頻的聲學指標、網(wǎng)絡指標及物理環(huán)境下對信號的主觀質(zhì)量進行全面詳細的評估,適應了不同環(huán)境下的差異化測評場景。

同時,多媒體實驗室開發(fā)了基于深度學習的全參考/無參考質(zhì)量評估算法。依托主觀測試平臺快速構(gòu)建大規(guī)模視頻數(shù)據(jù)庫的能力,多媒體實驗室收集了數(shù)百萬次的視頻質(zhì)量打分,訓練了基于深度學習的全參考和無參考質(zhì)量評估算法。兩個算法在公開數(shù)據(jù)集上均取得了領(lǐng)先業(yè)界的性能。王海強提到多媒體實驗室會在近期內(nèi)把算法開源,進一步促進行業(yè)的發(fā)展。

除滿足單個評估需求外,視頻質(zhì)量評估還將在業(yè)務線中進一步發(fā)揮作用。王海強認為,在業(yè)務線中引入視頻質(zhì)量評估后,將改變以往被動發(fā)現(xiàn)質(zhì)量問題、進行人工檢查的狀況,變被動為主動,變?nèi)斯橹悄埽肁I進行預防性質(zhì)量監(jiān)控,并通過算法迭代不斷實現(xiàn)系統(tǒng)優(yōu)化,同時,評估系統(tǒng)的優(yōu)化又會進一步反哺業(yè)務線的優(yōu)化。

在當前音視迎來發(fā)展風口之時,騰訊多媒體實驗室不僅使非專業(yè)團隊能夠快速、準確的完成評估需求,還通過一系列嘗試,推動了音視頻質(zhì)量評測標準的討論。近50項提案被下一代視頻編碼標準VVC/H.266采納。此外,在虛擬現(xiàn)實(VR)、點云(PCC)、網(wǎng)絡傳輸協(xié)議 (DASH)、多媒體系統(tǒng)(OMAF、CMAF、NBMP)等相關(guān)多媒體標準中也取得了突破性進展,獲得多項標準核心專利,多名團隊成員在多個全球標準組織擔任董事、編輯、領(lǐng)域主席等重要席位。與此同時,多媒體實驗室也大力投入國家自主標準建設,針對國家標準AVS3進行了相關(guān)布局,成為國際行業(yè)標準不可忽視的影響者和領(lǐng)導者。

未來,騰訊多媒體實驗室也將投入更多技術(shù)與實踐,帶頭制定行業(yè)規(guī)則,不斷提升用戶視聽體驗。



關(guān)鍵詞: 多媒體實驗室 騰訊 音視頻

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉