我正在分析网站的日志,我想构建一个分类器来预测可能点击广告的用户。
广告可以多次显示给访问者。
要构建任何分类器,我需要正面和负面的例子:
- 积极因素是点击广告的访问者(简单)。
- 负面因素是看到广告但没有点击的访问者(不是很明显)。
问题
- 是否有关于如何/何时将用户视为负面示例的约定?
我认为我应该定义每个用户的展示次数(浏览量)阈值,如果用户在没有点击广告的情况下达到了这个阈值,我认为他/她是负面的例子吗?
非常感谢任何参考或指导。
我正在分析网站的日志,我想构建一个分类器来预测可能点击广告的用户。
广告可以多次显示给访问者。
要构建任何分类器,我需要正面和负面的例子:
问题
我认为我应该定义每个用户的展示次数(浏览量)阈值,如果用户在没有点击广告的情况下达到了这个阈值,我认为他/她是负面的例子吗?
非常感谢任何参考或指导。
你想多了。您可能不需要阈值。从最简单的方法开始:如果您向访问者展示广告,那么这是一个反面例子。每次您向访问者展示广告时,您都会得到一个实例,无论是正面的还是负面的。如果您向同一访问者展示了 3 次广告,那么您最终会得到 3 个示例。(也许都是负面的;或者一个是正面的,两个是负面的;但这很好。)
额外提示:研究处理类不平衡的方法。