7场季后赛系列赛统计

机器算法验证 可能性 游戏 赔率
2022-03-30 04:34:07

背景:我的一个朋友有一个爱好(我想很多人都会这样做),试图预测曲棍球季后赛的结果。他试图猜测每场比赛的获胜球队,以及获胜所需的比赛次数(对于不熟悉 NHL 曲棍球的人来说,系列赛由 7 人中的最佳决定)。他今年3轮比赛后的记录(8+4+2=14场7胜1负)获胜球队7对/7错,场数4对/10错(他只考虑场数正确)如果他也选择了获胜的球队)。

我们开玩笑说他在团队问题上的表现并不比盲目猜测好,但如果假设 4、5、6 或 7 场比赛系列的概率相等(预计成功率为 12.5%率,他是 28.5%)。

这让我们想知道每种可能的游戏数量的实际赔率是多少。我想我已经解决了,但我想解决一些松散的问题,因为我的方法的一部分是蛮力在一张大纸上涂鸦。我的基本假设是每场比赛的结果都是随机的12为每支球队获胜。

我的结论是:

P(4games)=224=12.5%P(5games)=825=25%P(6games)=2026=31.25%P(7games)=4027=31.25%

我基于一个概念指导我的分析,即 4 个游戏系列应该有224,类似于抛 4 个硬币并得到 4 个正面或 4 个反面的概率。分母很容易从那里弄清楚。我通过计算给定比赛数量的结果的“合法”组合的数量(WWLWWLL 将是非法的,因为该系列将在 5 场比赛后决定,最后 2 场比赛不会进行)得到分子:

Possible 4 game series (2):
WWWW LLLL

Possible 5 game series (8):
LWWWW WLLLL
WLWWW LWLLL
WWLWW LLWLL
WWWLW LLLWL

Possible 6 game series (20):
LLWWWW WWLLLL
LWLWWW WLWLLL
LWWLWW WLLWLL
LWWWLW WLLLWL
WLLWWW LWWLLL
WLWLWW LWLWLL
WLWWLW LWLLWL
WWLLWW LLWWLL
WWLWLW LLWLWL
WWWLLW LLLWWL

Possible 7 game series (40):

LLLWWWW WWWLLLL
LLWLWWW WWLWLLL
LLWWLWW WWLLWLL
LLWWWLW WWLLLWL
LWLLWWW WLWWLLL
LWLWLWW WLWLWLL
LWLWWLW WLWLLWL
LWWLLWW WLLWWLL
LWWLWLW WLLWLWL
LWWWLLW WLLLWWL
WLLLWWW LWWWLLL
WLLWLWW LWWLWLL
WLLWWLW LWWLLWL
WLWLLWW LWLWWLL
WLWLWLW LWLWLWL
WLWWLLW LWLLWWL
WWLLLWW LLWWWLL
WWLLWLW LLWWLWL
WWLWLLW LLWLWWL
WWWLLLW LLLWWWL

推导分子的非暴力方法是什么?我在想可能有一个递归定义,所以P(5games)可以定义为P(4games)等等,和/或它可能涉及组合,如(probabilityofatleast4/7W)×(probabilityoflegalcombinationof7outcomes),但我有点卡住了。最初我想到了一些想法,涉及(kn)但似乎只有在结果的顺序无关紧要时才有效。

有趣的是,另一位共同的朋友提取了一些关于 7 场比赛系列(NHL、NBA、MLB 1905-2013、1220 系列)的统计数据并得出:

4 Game Series - 202 times - 16.5%
5 Game Series - 320 times - 26.23%
6 Game Series - 384 times - 31.47%
7 Game Series - 314 times - 25.73%

这实际上是一个非常好的匹配(至少从我的天文学家的角度来看!)。我猜这种差异来自于每场比赛的结果都偏向于一支球队或另一支球队的胜利(事实上,球队通常在第一轮种子,因此领先的排位赛球队与勉强晋级的球队比赛,第二名倒数第二名,以此类推……而且大部分比赛都在第一轮)。

4个回答

一支球队要想在第 N 场比赛中赢得 [系列赛],他们必须在前 N-1 场比赛中恰好赢了 3 场。对于第七场比赛,有(63)=20方法来做到这一点。第七场比赛有 2 种可能的结果,每支可以获胜的球队有 20 种可能的获胜组合,因此有 40 种可能的结果。对于N 场系列赛,以 N 场比赛结束的七局两胜的系列赛,可能性的数量为2(N13).

事实上,如果您已经知道玩过的游戏数量,那么顺序并不重要。只有最后一场比赛很重要,获胜者必须有 3 场之前的胜利,不分先后。

如果 p 是赢得单场比赛的概率,N 是赢得系列赛所需的比赛数,那么赢得系列赛的概率“P”由下式给出:

P=pN(N1)!i=0N1[(j=1N1(i+j))(1p)i]

想一想游戏以每个玩家的积分作为路径进行的方式。导致胜利的每条路径都有一个概率,该概率由获胜和失败次数的概率乘积给出。下图试图说明一个例子。 推导说明

系数的模式由 (i+N-1) 选择 (i) 给出,其中“i”是对手的得分,N 是获胜的得分。

请记住,选择公式是:

nCr=n!r!(nr)!

所以对我们来说:

nCr=(i+N1)!i!(N1)!=(i+1)...(i+N1)(N1)!=j=1N1(i+j)(N1)!

另一种看待方法是二项分布:您需要在 n = 6 (trails) 中 x=3(恰好 3 次成功),所以如果赢得比赛的概率是 0.5(两支球队同样可能),二项式将说:P(x=3) = 6C3 * (.5)^3 * (.5)^3 = .3125 这意味着有 31.25% 的机会参加 7 场系列赛。而你在第 7 场比赛中获胜的概率,将遵循负二项式,多少条线索 = 7 表示 4 成功,7-1 C 4-1 * (.5)^3 * (.5)^4

关于现实生活中结果的差异,OP 指出“我猜这种差异来自于每场比赛的结果都偏向于一支球队或另一支球队的胜利(事实上,球队通常在第一轮播种,所以排位赛领先的队伍对阵勉强晋级的队伍,第二名的队伍倒数第二,以此类推。 ” ...

我会注意到,即使是随机排序也会导致这种现象,因为许多游戏会配对具有不同技能水平的团队。事实上,我能想到的唯一系统与理论相匹配的实际结果是#1 与#2 等配对并且配对巧合均匀匹配的系统(或者联盟给予主场优势失败者)。但即便如此,即使是随机分配,第二轮也几乎肯定会出现不匹配的球队。

换句话说,理论结果将始终代表最佳情况。