Meta公布全新AI語音壓縮技術EnCodec 訓練模型涵蓋編碼器等部分

        2022-11-06 19:54:13       來源:3DMGame

        Meta近日公布全新AI語音壓縮技術“EnCodec”,該技術號稱可以64kbps的速度壓縮比MP3格式小10倍的音頻,同時還能保證不會損失質量。

        Meta指出,壓縮技術對目前互聯網十分重要,借助于此用戶可以十分容易的發送高畫質圖片、語音信息等。不過,發送這些多媒體信息需要充足的帶寬和存儲空間,尤其是在未來的時代,因此需要效果更好的壓縮技術。

        據介紹,“EnCodec”AI訓練模型涵蓋三個部分,分別為編碼器、量化器和解碼器。

        編碼器可將原始數據轉換為較低影幀速率的格式,再由量化器將數據壓縮到目標大小,最后,解碼器通過神經網絡對這些數據進行解碼。

        值得一提的是,雖然此前也有人嘗試用神經網絡壓縮音頻,但Meta是首個將此技術用于48kHz立體聲的團隊。

        x 廣告
        x 廣告

        Copyright @  2015-2022 海外生活網版權所有  備案號: 滬ICP備2020036824號-21   聯系郵箱:562 66 29@qq.com