建立两组数据之间的关系

数据挖掘 相关性
2022-03-11 22:59:35

我有两个数据集 - 产品到功能和产品到零件

A = { (P1, F1, F2, F3), (P2, F2, F4, F6), (P3, F1, F6, F8)...}
B = { (P1, M1, M2, M3), (P2, M4, M7), (P3, M1, M5, M7, M9, M10)..}

在哪里:

P1、P2、P3... 是产品
F1、F2、F3... 是特征
M1、M2、M3... 是用于建筑产品的零件。

是否有可能提出特征和零件之间的关系?

例如(F1,M1,M2),(F2,M1,M4,M6)......等等?

2个回答

我认为您可以使用关联规则学习来阐明特征和部件之间的关系。您可以像对待购物篮中的物品一样对待零件和特征。

更新:

A = {('P1', 'F1', 'F2', 'F3'),
     ('P2', 'F2', 'F4', 'F6'),
     ('P3', 'F1', 'F6', 'F8')}

B = {('P1', 'M1', 'M2', 'M3'),
    ('P2', 'M4', 'M7'),
    ('P3', 'M1', 'M5', 'M7', 'M9', 'M10')}

parts = {'P1','P2','P3'}

basket = {}
for k in parts:
    temp = []
    for a in A:
        if k in a:
            temp += list(a)
    for b in B:
        if k in b:
            temp += list(b)
    temp.remove(k)
    basket[k] = temp

然后将basket字典中的每个值用作一个篮子。

这完全取决于特征与部件的关系。

如果它们相关,您可以为每个产品形成一个(功能部件)的二分图。如果特征和产品之间没有关系,则可以形成双方图。

在此处输入图像描述

如果你的关系不正确,你总是可以形成一个元组关系。

{p1: (f1, m1), (f2, m1)}

这最终取决于您的数据集及其相互之间的关系。