信息处理 - 高噪声、低增益的语音恢复 - 吾爱随笔录

高噪声、低增益的语音恢复

信息处理声音的嗓音

2022-02-16 16:30:07

我对两位演讲者进行了录音采访，其中一个声音的增益比另一个高得多（三个数量级）。增加增益并没有帮助，因为扬声器 2 的声音非常安静，以至于达到了数字化限制（我相信）。音频质量并不重要，但有一个近似的技术会很有帮助，这样单词就可以理解了。

如果有帮助，我可以尝试在此处发布特定失真的音频示例。声音的韵律是有的，但它是如此的混乱，以至于无法理解。基本的插值和过滤（都是长镜头）在恢复声音方面没有成功。

任何有关分析技术和/或软件的建议将不胜感激。

3个回答

我建议将动态范围压缩作为第一个调用端口。将阈值设置得低且比率相当高。然后将补偿增益应用到适当的水平。此功能内置于许多免费的音频编辑器中，例如 Audacity。Matlab 或 Python 实现也相当简单。

您还可以使用自动增益控制（AGC），用于幅度差异巨大的这种情况。我认为这个 matlab 脚本可能很有用 - http://in.mathworks.com/matlabcentral/fileexchange/11202-automatic - 获得控制

我可能会尝试Audiophonic，这是一种基于网络的播客后期制作服务。它会自动执行您想要的处理类型。每月前两个小时的音频是免费的（截至撰写本文时）。它包括一个“智能调平器”和“响度归一化”。如果体积差异太大，全自动解决方案可能会窒息。但值得一试。或者你可以做一些其他评论中提到的技巧来让它更好地成型，让 Audiophonic 做剩下的事情。

其它你可能感兴趣的问题

上一篇传递函数的阶数如何从其等效状态空间表示中推导出来？下一篇滚动线性回归的频率响应