为 ASR 创建发音词典

数据挖掘 机器学习 数据集 nlp 语音转文本
2022-02-23 01:21:14

我正在研究索马里数据的 ASR(自动语音识别)作为硕士论文,现在我被困在如何为其创建语音或发音词典。我在网上搜索并找不到一个。

我不知道如何解决这个问题。有人可以指导我吗?

2个回答

我也在 reddit 上发布了一个类似的问题,我得到了Nikolay Shmyrev的回复:

“如果你想转换拉丁文字,你可以自己写简单的规则。像这样的东西。或者你可以按原样使用 Epitran。”

感谢最初在 reddit 中回答的Nikolay Shmyrev 。

网络上有许多现有的ASR 数据集,但我找不到专门针对索马里语的数据集。如果你碰巧找到了一个,并且它没有涵盖感兴趣的单词,你可以使用g2p 工具对其进行扩展。

如果您想从头开始制作发音词典,则语音词典通常由手写规则引导。您可以在有关您的语言的 Wikipedia 页面中找到您的语言的音素列表,并编写一个简单的 Python 脚本来将单词映射到音素。