从每日概率到年率:比我想象的更复杂?

机器算法验证 可能性
2022-04-14 13:07:56

我试图从预测变量与事件发生概率()之间的函数关系到事件发生的总体速率。与给定所述流量的鱼逃逸概率之间的关系来估计鱼从水库中逃逸的年率假设是离散关系,即我已经离散化了连续函数P=f(X)QP=f(Q)P=f(Q)f(Q)

与经验数据表明的相比,我的年度擒纵率值非常低(~3% vs 超过 13%),所以我担心我将每日擒纵概率提升到年度擒纵概率的方法存在缺陷。我计算擒纵机构年概率的最初想法是公式

Pannual=i1[1P(Qi)]di

其中离散化的给定流量,是一年中水库流量以该速率保持的总天数。在没有任何更好的信息的情况下,鉴于水库中有相当多的鱼群,我假设年逃逸率等于年逃逸概率,即Qif(Q)di

Nescaped=NPannual
其中是当年鱼类的起始种群,是当年逃脱的鱼类数量。NNescaped

环顾该网站,关于我对的定义是否可以接受似乎存在一些争论,我不确定我是否正确定义或者它不能转换为N_我定义的方式。任何概率专家可以为我澄清事情吗?Nescaped PannualNescaped

编辑

感谢@Creosote 的回答,年度擒纵概率的正确公式实际上应该是 但是,这会改变我对订单的结果0.01%,所以我的问题没有解决(或者问题不在于配方)。我从这篇论文中获得了放电擒纵曲线

Pannual=1i[1f(Qi)]di
. 论文中 2009--2011 年 13% 的年度擒纵估计是基于标记重新捕获研究,曲线(具有 95% 置信区间)基于作者从相同数据生成的多状态模型(I已经获得了仅放电模型生成的曲线,该模型预测的擒纵机构略高于论文中的数字)。我使用水库释放记录来计算释放在给定“流量带”内的天数,例如一年中流量在 1000 cfs 和 1250 cfs 之间的天数。流动带实际上是这样定义的,使得每个带的边界跨越 0.005% 的擒纵概率变化。

即使使用曲线的置信上限,我在任何年份都不会超过 4%。我认识到这两个结果之间应该存在一些差异,但我实际上预计我的擒纵速率会更高,因为该模型考虑了标签丢失和死亡率。有任何想法吗?

编辑 2

我接受 Creosote 的回答,因为它提供了从每日概率扩大到每年概率的正确方法。EdM 的回答也非常有帮助,指出这个问题可能更多地与擒纵放电模型的基础有关,而不是与升级程序有关。如果我获得有关我的问题的更多信息,我将发布另一个编辑,但每日 - > 年度概率问题似乎已解决。

2个回答

随机选择的鱼在随机选择的日子排出将保持原位,概率的概率在全年保持不变,所以你的是减去那个。假设我已经理解了你的符号,那就是。Qi1f(Qi)i(1f(Qi))diPannual

作为一个健全的检查,考虑一个恒定的每日“逃生概率” 0.0004 (0.04%),没有将逃生的鱼放回湖中。365 天后,一个人没有逃脱的概率为,即 0.864 或 13.6% 的逃脱概率。这大约相当于引用论文中基于标记和重新捕获的年度逃脱概率。因此,您应该寻找 0.04% 的典型每日逃逸概率来解释大约 13% 的年率。(10.0004)365

来自引用论文的第 646 页:“模型平均表明每日擒纵概率约为 0.01%”;这只是 3.6% 的年化率,与您所发现的相似。但是,您应该注意,作者在该页前面的方法结尾处声明:“从 Program MARK 获得的擒纵机构估计......仅提供了无法推断为年度擒纵速率的擒纵机构的每日估计值。” (强调补充)。我不熟悉分析程序,但很明显,本文提供的估计值不能可靠地以您想要的方式使用。您可能想咨询研究(或分析程序)的作者,了解为什么会出现这种情况。

此外,您应该注意,在研究期间的 3 个月内,“每日排放率增加到 85 ”(第 649 页),高于图 5 中显示“移民概率”和释放。“随着平均每日排放量从 8 增加到 61 ,擒纵装置呈指数增长”(第 646 页),因此,主要基于低排放量条件的每日擒纵装置估计值会低估年排放量,这可能不足为奇。m3/sm3/s