我的理解是:
- 随机缺失:一个变量的值是否缺失取决于其他变量的值。
- 非随机缺失:当变量值缺失的倾向取决于该值时。
但是,当变量相互关联时,它们通常是怎样的呢?
为了使事情更具体,让我们考虑一个收集温度、湿度和二氧化碳数据的实验,假设它们之间的关系是T = H = C。
假设我们缺少低于 50 的所有 CO2 变量,因为传感器冻结。
在这种情况下,它是
随机缺失:因为 CO2 的缺失倾向取决于温度和湿度的值。非随机缺失:因为所有低于 50 的 CO2 值均缺失。
由于变量是相互关联的,随机缺失 => 非随机缺失。
还是我在某个地方的推理有误?