使用哪些统计测试?日食期间量化的蜜蜂飞行活动

机器算法验证 统计学意义 重复测量
2022-03-21 11:09:21

我正在尝试进行统计分析,但不确定哪种测试最合适。实验和样本数据片段如下:

方法:使用一些精美的软件记录、跟踪和量化蜂巢中的蜜蜂飞行。在 3 小时内,连续 2 天从同一个蜂巢进行 2 分钟的记录,每 15 分钟一次。第 1 天下午 3 点 15 分出现日食。第 2 天是正常的一天。在每个时间点,我们只计算了 1 个数字。假设在每个时间点飞行的蜜蜂数量是可变的,并且不依赖于较早/较晚的时间。假设是在日食期间蜜蜂的飞行活动会有所不同。

Time    Day 1       Day 2 
1:45    4.825986975 5.011309825 
2:00    4.76436878  4.944759887 
2:15    4.857806302 4.995020539 
2:30    5.160417753 5.098229915 
2:45    5.151340989 5.123143909 
3:00    5.205157211 5.01482563 
3:15    5.576328277 5.060712789 
3:30    5.499265895 4.767659804 
3:45    5.341123626 4.698898463 
4:00    4.511481755 4.336670549 
4:15    4.454618556 4.540783545 
4:30    4.475789132 4.203964626 
4:45    4.378358091 4.239819416 

结果:在日食开始期间,我们在视觉上看到了更多的飞行。绘制曲线时,曲线定性地显示了日食期间的差异。

问题:

  1. 在数据集上运行什么统计测试是正确的,以说明第 1 天和第 2 天之间是否存在差异(换句话说,日食是否对第 1 天的飞行活动产生了有意义的影响)?我意识到整个设置有一些警告,但我要问的是关于统计数据..

  2. 我可以使用测试来查看在日食日期间是否有有意义的变化吗?

  3. 我知道日食期间的阳光强度(辐照度)。我可以做 Pearson's 来寻找强度和飞行活动之间的相关性吗?

1个回答

这是两天数据的图表(第 1 天,带有黑色标记的金线,第 2 天带有金色标记的黑线;我以自当天第一次测量后经过的分钟数来编码时间):

蜂区飞行活动数据

问“第 1 天和第 2 天之间是否有区别”的问题在于答案是肯定的。有很多不同之处:

  1. 在每次测量时,蜜蜂的飞行活动区域都是不同的(即使在没有日食的时期)。
  2. 每天,蜜蜂的飞行活动区域都存在差异:第 1 天和第 2 天都经历了下降,然后在 2:45 到 3:15(90 分钟)之间达到顶峰,然后在此后的活动中下降。
  3. 蜜蜂在任何时间点的飞行活动区域似乎与15 分钟前的活动略有不同,除了大约 3:30 到 4:00(105 到 120 分钟)。
  4. 蜜蜂飞行活动面积的峰值测量值是在第 1 天 3:15,与第 2 天相差30 分钟(更早)。
  5. 第 1 天的平均蜜蜂飞行活动面积为 4.94,但第 2 天为 4.77;同样,第 1 天 (0.0131) 的方差与第 2 天 (0.00874)的差异有很大差异。

可能有更多的方式来构想这两天之间的“差异”。

因此:当您可以更准确地阐明哪些差异对您很重要时,统计数据对您将更有用。

这是另一个图表,但这次是第 1 天的活动减去第 2 天的活动:

蜜蜂飞行活动面积的差异

如果这两天非常相似,我们可能会期望曲线以 0 为中心垂直居中。如果我们有相同时间蜜蜂测量的日食活动(不活动?)数据,我们可以询问这段时间的日食曲线是否看起来就像蜜蜂差异曲线。您关于皮尔逊相关系数的问题将是解决此问题的一种方法。回归将是另一个,并且会提供更多信息。您可以在这种情况下执行测试(例如,Pearson 的的测试,或线的斜率的测试)。但同样,您可能需要仔细考虑哪些差异对您有意义ρ=0β=0