我想知道是否有一个很好的例子可以将 N-Gram 与各种平滑技术进行比较。
我发现了这个应用拉普拉斯变换的笔记本,但仅此而已。非常感谢任何建议。
关于这个主题有很多论文,但您可能应该使用术语语言建模(平滑 n-gram 频率的主要应用程序的名称)进行搜索。
显然有一篇最近的论文,但否则你很可能会找到 20 年前的论文,因为这曾经是统计机器翻译的一个重要问题(它不再是神经 MT,afaik)。