我们有一个在线商店数据库(产品、客户、销售)的经典结构,我们希望实现一个经常一起购买的功能。我们的软件在 ASP.NET 中,我们不知道 PHP 来逆向工程是如何在 Magento 中完成的。
我们所需要的只是一个简单的经常一起购买(不像 Magento 提供的折扣)。
我知道这是机器学习,更常见的方法之一是 Jaccard 系数。这是推荐的方式吗?
然而,我的主要问题是我在数据库中创建的视图应该是什么样子?Jaccard 系数和其他相关测试要求最好使用的表格结构是什么?
我们有一个在线商店数据库(产品、客户、销售)的经典结构,我们希望实现一个经常一起购买的功能。我们的软件在 ASP.NET 中,我们不知道 PHP 来逆向工程是如何在 Magento 中完成的。
我们所需要的只是一个简单的经常一起购买(不像 Magento 提供的折扣)。
我知道这是机器学习,更常见的方法之一是 Jaccard 系数。这是推荐的方式吗?
然而,我的主要问题是我在数据库中创建的视图应该是什么样子?Jaccard 系数和其他相关测试要求最好使用的表格结构是什么?
它被称为关联规则挖掘。您可以轻松实现该算法的一个非常基本的版本,该版本适用于中小型数据集。该算法所做的基本上是在所有事务中查找最频繁的项目。在您的示例中,您可以在您的在线商店中找到客户一起购买的常见商品。我在 .Net 中为一门课程实现了一个,我只花了 2 天时间就理解并编写了代码。
数据的格式实际上取决于实现,例如,我的算法读取文本文件中的数据,该文件的每一行都是一个项目元组:
1,2,3
4,3,5
6,1,4,5,1
7,6,5
其中每一行都是一笔交易,数字可以是用户在一次结账时购买的商品。该算法需要一个称为阈值的数字。这意味着算法会找到在所有交易中重复 X 次(可以是百分比)的项目模式。结果可以是几行,每行都是在交易中一起购买并设法满足阈值的项目的组合。