機器可以利用人工智能創造出看起來或聽起來非常真實的照片或語音記錄。波鴻魯爾大學Horst Görtz信息技術安全研究所的Joel Frank和Lea Schönherr對如何將這種人工生成的數據(深度偽造數據)與真實數據區分開來很感興趣,他們在神經信息處理系統會議上介紹了他們的成果。
作為第一步,Joel Frank和Lea Schönherr匯編了一個大型數據集,其中包括大約118000個人工生成的語音記錄,總共大約196小時的英語和日語材料。
研究員說:以前沒有這樣的音頻深度偽造的數據集,但為了改進檢測虛假音頻的方法,研究員需要所有這些材料。為了確保數據集盡可能的多樣化,該團隊在生成音頻片段時使用了六種不同的人工智能算法。
然后,研究人員將人造音頻與真實對話的錄音進行了比較。他們將這些文件繪制成頻譜圖,讓頻率分布可視化。比較結果顯示,真假文件之間的高頻存在著微妙的差異。
基于這些發現,Frank和Schönherr開發了能夠區分深層造假對話和真實講話的算法。這些算法是一個起點,可供其他研究人員開發新的檢測方法。
前瞻經濟學人APP資訊組
參考資料:https://www.eurekalert.org/news-releases/938511