多状态时间延迟神经网络 (MS-TDNN) 在
Haffner,Patrick 和 Waibel,Alex:用于连续语音识别的多状态时间延迟网络。在神经信息处理系统的进展中,1992 年。
它们是 TDNN 的扩展。TDNN 是用于自动语音识别 (ASR) 的卷积神经网络,其中卷积随时间发生。
MS-TDNN 的目标似乎是摆脱 ASR 中的混合方法,在这种方法中,您需要动态编程/HMM 来分块音频流,然后使用神经网络来识别音素。不知何故,MS-TDNN 似乎也可以进行分割。
我不明白怎么做。有人可以向我解释一下吗?
(相关的问题:MS-TDNNs 是循环网络吗?“多态”这个名字究竟是从哪里来的?)