在准备我的数据以汇集到 Microsoft 关联规则算法时,我不确定是否应该按事务和项目按数据分组,或者为事务中的每个项目实例记录。如果一个项目在交易中出现 3 次,算法是否关心并增加权重,或者它只是寻找一个项目与另一个项目的存在,而不管存在多少?
交易中的项目数量是否与先验有关?
数据挖掘
数据挖掘
关联规则
市场篮子分析
2022-02-23 18:47:12
1个回答
不,这并不重要,强烈建议在每个事务中删除重复的项目并按字典顺序对项目进行排序。这是为了提高性能。
在关联规则挖掘中,如果一个项目在多个事务中而不是在单个事务中重复,则它是频繁的。这就是为什么您不需要在每笔交易中都有重复的项目。
其它你可能感兴趣的问题