当有那么多未知数时,通常你会说“我不知道概率”。例如,您当地的博彩公司不会为您提供有关这棵树的事件的赔率,并且您当地的保险代理人不会向您出售针对它的保险。
为了产生概率,您可以采取至少两种方法之一:
让这个人从不同的角度、一天中的时间等多次向窗外看,记录他们什么时候看到一棵树,什么时候没看到,并得出一个频率。将此用作概率。您甚至不必知道白天发生了多少试验,晚上发生了多少。您不知道哪些因素会影响是否看到一棵树。你只知道你已经测量了你感兴趣的事件。
考虑所有变量,进行大量测量,定义一个更精确的模型来描述正在发生的事情,将概率分布放在模型的每个参数上(例如“一天中的时间”、“扫视角度”),以及从您的模型告诉您的时间/角度/等中得出事件的概率,这些时间/角度/等会产生树木观测。
非常笼统地说,办公室经理可能会使用前一种方法来解决诸如“我办公室里有人感染 COVID-19 的概率是多少?”之类的问题,在这种情况下,您确实无法进行大量仔细的研究和建模,但也许您确实可以获得各种测试的自我报告结果,或者无法获得政府对整个人群中 COVID-19 流行率的估计。
“科学家”[*] 可能会使用第二种方法来解决诸如“COVID-19 患者在走进拥挤的超市时会感染至少另一个人的概率是多少?”之类的问题,即一位坚定的流行病学家可能会尝试解决的事情。当然,这并不一定意味着所有流行病学家都会得出相同的答案,因为他们可能会决定要忽略什么、要在模型中包含什么以及如何对其进行建模,这意味着他们会得到不同的数字。
您通常不能假设“我的物理/生物学/购物理论是完全错误的,因此由此得出的一切都是假的”,因为您既没有好的模型也没有好的观察频率。最好不要认为“每一个可以想象的事件都有一个概率,我的任务就是计算它”。相反,实际的物理世界已经观察到了事件,你对这个世界建立的任何概率模型都会产生概率,两者之间的任何关系都取决于你的模型是否好。
我们 100% 确信从 1 到 4 的统一选择有 0.25 的概率给出数字 3,因为这是一个紧随其定义的数学定理。我们确信数学定义。在我们确信其真实性的句子中甚至没有描述真实世界的事件:它只是“均匀离散概率分布”定义的直接应用。我们 100% 确定数学这一事实(这本身可以说是一个见仁见智的问题,但你说你是,我相信你)并不能帮助我们确定我们对光学或医学的确定程度幻觉理论,或者那些树不会在晚上被吹倒,因此明天发现它们的可能性与今天大不相同。
然而,为保险公司工作的统计学家实际上可能拥有关于全国夜间树木倒塌发生率的相当好的数据。他们可能会关心的原因是,如果您的房子附近有一棵树,他们可能想就是否应该指示您将其移走,或者至少向您收取的建筑物保险费高于建筑物的保险费提出意见远离树木。因此,任何特定因素都需要研究,但要产生概率,你总是必须在某个时候决定忽略所有你没有研究过的东西。
[*] 与令人恐惧的新闻表达“科学家们说……”中的相同,这很可能意味着文章的其余部分将省略所有科学理论和常识的细微差别。