我试图理解随机游走中的半监督学习。假设我有 10 个类,并且有一些标记和未标记的点。现在,我需要在随机游走中使用半监督学习来找到未标记点的标签。
我可以为节点/元素定义转换矩阵 P,使得每个条目给出从节点 i 移动到 j 的概率。现在我可以传播标签了。如果 P 是转移矩阵,我可以将 P 重置为
P =
如果 Y 表示标签集上的概率分布矩阵,那么我可以使用以下迭代算法来获取未标记点的标签。假设是给定的标记点集,是我们必须为其找到标签的未标记点集。让我们说为 10 个标签给出了 10 个标记点,我必须找到剩余 100 个点的标签让我们说,然后有这个迭代算法
重复
直到收敛到
一开始我没有得到如何初始化这个 Y 向量。假设我有 110 分。我有十个点的标签 1.2.3...10,那么我将如何初始化这个 Y 矩阵,最后当我得到时,我将如何知道它属于哪个类。我的意思是我只会有一些价值观。我怎么知道中未标记的点属于哪个类。如果它是二进制的,我会知道,因为如果值大于 0.5,我会说它属于 1 类,否则为 0。但是当我有十个标签时会怎样。