我是 ML、线性代数、统计等方面的新手,所以请耐心等待术语...
我正在寻找一个向量,它为 1)向量维度之间的所有关系(由减法确定)和 2)由所述关系产生的一些输出值之间的关系产生最大相关性。我专门使用它来创建一个运动排名系统,该系统采用多场比赛和结果得分,并尝试为可用于预测未来得分的球队分配一个值。换句话说,任何两支球队的评分之间的差异应该可以预测两者之间下一场比赛的得分差异。
例如,如果我有 3 个团队,A、B 和 C,每个团队都以未知评分开始:
如果每支球队都与对方球队打过一次,那么左表将用于计算他们的评分差异(列队的评分减去行队的评分)。正确的表格将是各自比赛中的得分差异。
对于此示例,这是一个可能的解决方案,它将导致团队评分差异和得分差异之间的完美相关性。
这将是回归线,其中 x 2是列团队的评分,x 1是行团队的评分。
值得注意的是,重要的是各种值(不是它们的标称值)之间的关系,因为这将是另一种可能的解决方案:
这将产生一个看起来像这样的线性方程,其相关性也为 1:
我想要做的是找到一种方法来确定 A、B 和 C 的值,以最大化成对差异和结果输出值之间的相关性。团队示例的另一个问题是,并非每个团队都会与其他团队比赛,因此任何结果矩阵都是不对称的(假设这很重要)。
有没有现有的技术可以解决这个问题?