我对两位演讲者进行了录音采访,其中一个声音的增益比另一个高得多(三个数量级)。增加增益并没有帮助,因为扬声器 2 的声音非常安静,以至于达到了数字化限制(我相信)。音频质量并不重要,但有一个近似的技术会很有帮助,这样单词就可以理解了。
如果有帮助,我可以尝试在此处发布特定失真的音频示例。声音的韵律是有的,但它是如此的混乱,以至于无法理解。基本的插值和过滤(都是长镜头)在恢复声音方面没有成功。
任何有关分析技术和/或软件的建议将不胜感激。
我对两位演讲者进行了录音采访,其中一个声音的增益比另一个高得多(三个数量级)。增加增益并没有帮助,因为扬声器 2 的声音非常安静,以至于达到了数字化限制(我相信)。音频质量并不重要,但有一个近似的技术会很有帮助,这样单词就可以理解了。
如果有帮助,我可以尝试在此处发布特定失真的音频示例。声音的韵律是有的,但它是如此的混乱,以至于无法理解。基本的插值和过滤(都是长镜头)在恢复声音方面没有成功。
任何有关分析技术和/或软件的建议将不胜感激。
我建议将动态范围压缩作为第一个调用端口。将阈值设置得低且比率相当高。然后将补偿增益应用到适当的水平。此功能内置于许多免费的音频编辑器中,例如 Audacity。Matlab 或 Python 实现也相当简单。
您还可以使用自动增益控制(AGC),用于幅度差异巨大的这种情况。我认为这个 matlab 脚本可能很有用 - http://in.mathworks.com/matlabcentral/fileexchange/11202-automatic - 获得控制
我可能会尝试Audiophonic,这是一种基于网络的播客后期制作服务。它会自动执行您想要的处理类型。每月前两个小时的音频是免费的(截至撰写本文时)。它包括一个“智能调平器”和“响度归一化”。如果体积差异太大,全自动解决方案可能会窒息。但值得一试。或者你可以做一些其他评论中提到的技巧来让它更好地成型,让 Audiophonic 做剩下的事情。