我试图根据几个因素(一周中的哪一天、自上次访问以来的时间等)来预测用户访问特定网站的概率。我的问题是如果分子项之一变为零怎么办?
例如,假设我经常访问 www.google.com,但我从未在星期一访问过。为零。我是否只是从等式中完全删除了这个术语?
我试图根据几个因素(一周中的哪一天、自上次访问以来的时间等)来预测用户访问特定网站的概率。我的问题是如果分子项之一变为零怎么办?
例如,假设我经常访问 www.google.com,但我从未在星期一访问过。为零。我是否只是从等式中完全删除了这个术语?
解决此问题的一种方法是将所有计数增加 1。这称为拉普拉斯平滑。如果你谷歌拉普拉斯平滑和朴素贝叶斯你会发现很多参考。
我以 1 开始所有计数,在伪代码中:Count=max(1,Count)。