让我们假设一个简单的场景:您想要预测各种房产的房价。数据集本质上是横截面的,因为您只观察每个属性一次。但是,您也有观察的时间戳(月/年)。
从某种意义上说,这意味着数据本质上是按时间排序的。一般来说,我知道对于时间序列数据,使用例如k 折交叉验证可能会出现问题。但是,我没有实时序列数据(一所房子有多个观测值),而是跨房子的时间排序数据。同样清楚的是,对于时间序列数据,还有其他方法,例如滚动估计。
特别是,我想从统计/计量经济学的角度从理论上理解为什么这可能是有问题的,而不仅仅是直觉。是否有人对此主题有理论指导或了解相关文献以深入研究该主题?
编辑:根据@Björn 的回答,在这里提供有关目标的更多信息似乎很有用。目标实际上是根据经过训练的模型预测未来价格。
