我有一个数据集,其中包含从用户小腿收集的原始 3 轴加速度计数据,我想创建一个分类模型(尽可能简单)来检测用户是坐下还是站立。我有大约 50,000 个事件(还有更多事件),这些事件标有正确的姿势,并且在姿势期间具有原始加速度。我从每个事件的原始数据(例如信号平均值、范围、频率内容等)中创建了一些特征,但这些特征都没有清楚地区分事件(在可视化数据集时)。
有没有一种方法可以从标记的原始数据中自动生成有用的特征,从而实现结果之间的良好分离?
如果这是不可能的,最好创建一个包含所有你能想到的特征的特征集,然后尝试找到解释结果之间最大差异的那些?你怎么做到这一点?我看过 PCA 和 LDA,但它们似乎没有“挑选”最好的功能,它们只是将它们组合到新组件中。
最后,是否有人对可以解释站立和坐下小腿运动差异的特征有任何想法。我假设与站立相比,坐着时小腿可以以更极端的角度移动,但你如何在特征中描述这一点。