将印地语文本转录为英文文本

数据挖掘 Python
2022-02-19 21:32:20

我正在研究印地语演讲。

我想将印地语文本转换为Python. 我对翻译不感兴趣。

所需效果的示例:输入“मेरा नाम मोहन है”以输出“mera naam mohan hai”。

1个回答

seq2seq RNN 模型:

基本上,我们需要将文本的脚本从印地语转换为英语。我们可以借助 seq2seq RNN 模型来做到这一点。这些模型广泛用于神经机器翻译。从这里了解更多

seq2seq RNN 模型可以将印地语单词序列作为输入,输出其对应的英语单词。

注意:由于这些模型在语言之间的翻译方面做得最好,我假设它们可以很好地在语言之间进行转录。

神经机器翻译系统

以上展示了如何使用 seq2seq 模型进行语言翻译。这样的模型也可以用于转录。请参阅此笔记本以在 TensorFlow Keras 中创建这样的系统。有关更多信息,请参阅这些链接:

  1. https://towardsdatascience.com/how-to-implement-seq2seq-lstm-model-in-keras-shortcutnlp-6f355f3e5639
  2. https://www.geeksforgeeks.org/seq2seq-model-in-machine-learning/
  3. https://www.analyticsvidhya.com/blog/2018/03/essentials-of-deep-learning-sequence-to-sequence-modelling-with-attention-part-i/

限制:

  • 您可以轻松获取用于翻译的训练数据。但是,没有可用于印地语和英语之间转录的数据。
  • 对于数据,您可以尝试在OpenData StackExchange 上发布问题。

提示:

有一个用于转录的 Google Cloud API。有关更多详细信息,请参见此处