我想测试与健康患者相比,阿尔茨海默病是否会导致大脑衰老的变化。
因此,我构建了大脑记录的光谱参数(特征或因变量)与年龄(年龄是自变量)的线性回归模型。
现在我希望将模型拟合到健康患者身上,然后使用系数来计算阿尔茨海默病患者的预期年龄 - 比较健康数据集和阿尔茨海默病数据集的均方误差应该有助于显示是否存在差异因疾病而衰老。(即,如果对健康患者有效的模型对阿尔茨海默病患者失败,那么可能存在差异)
我想我会在 80% 的健康患者(训练集)上拟合线性回归模型,保留 20%(作为测试集)来计算 MSE。
我会使用交叉验证,但我最终会得到与折叠一样多的不同系数集,我怎么知道哪些适合阿尔茨海默病患者?也许是系数的平均值?不过,交叉验证的一个优点是我可以从健康患者的集合中获得 MSE 估计值的平均值和标准偏差,因此我可以使用它来确定健康和患病 MSE 之间偏差的显着性,这很方便。
我想我也可以从阿尔茨海默氏症患者中多次采样子集并创建一组 MSE 估计值,然后我可以计算其标准差和平均值以了解那里的方差,所以我知道它的敏感度是那个特定的数据集。(我应该用替换来做这个,即引导?为什么或为什么不呢?)
任何意见是极大的赞赏。