Meta公布全新开源AI语音压缩技术:号称压缩率高十倍
Meta近日公布全新AI语音压缩技术“EnCodec”,该技术号称可以64kbps的速度压缩比MP3格式小10倍的音频,同时还能保证不会损失质量。
Meta指出,压缩技术对目前互联网十分重要,借助于此用户可以十分容易的发送高画质图片、语音信息等。不过,发送这些多媒体信息需要充足的带宽和存储空间,尤其是在未来的时代,因此需要效果更好的压缩技术。

据介绍,“EnCodec”AI训练模型涵盖三个部分,分别为编码器、量化器和解码器。

编码器可将原始数据转换为较低影帧速率的格式,再由量化器将数据压缩到目标大小,最后,解码器通过神经网络对这些数据进行解码。
值得一提的是,虽然此前也有人尝试用神经网络压缩音频,但Meta是首个将此技术用于48kHz立体声的团队。
0 
                            郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。
                        
                            相关阅读
                        
                        
                    
                            猜你喜欢
                        
                        -     
                                    始于Win95时代 微软开源27年前的3D Movie Maker软件2022-05-05
-     
                                    国产机械狗亮相冬奥 跟波士顿机器狗开源有关?网友释疑2022-02-12

 
                                         
                                         
                                         
                                         
                                         2022-05-05
2022-05-05 
  
  
                                         
                                         
                                         
                                         
  动画制作
动画制作