我正在做一些实验并尝试训练一个外汇交易模型来根据三个类别进行分类:
- 买
- 卖
- 无动作
输入行标记为buy稍后某个时间的价格比当前价格高sellX% 时,以及未来价格比当前价格低 X% 时标记。所有其他行都标记为no action,这是大多数行。
我遇到的问题是这些no action项目约占总数据集的 84%,但是该模型no action几乎 99% 的时间都在预测。我想这样做的原因是模型的目标是最大的准确性,它没有意识到no action物品是没有用的。
因此,如果可能的话,我希望模型只关心buy和项目,以最大限度地提高准确性,sell以希望增加预测的数量(在某种程度上这有助于模型的盈利能力)。buysell
我认为我可以做到这一点的一种方法是增加类的数量并让每个类代表总项目的大致相等的百分比,但是,这会很混乱,所以我很好奇是否有直接影响的方法计算精度的方式。
编辑: 我在此处添加了其他详细信息:CNN 测试结果中的可变性
但重点仍然是最大限度地提高买卖类别的准确性。查看 Tensorflow 指标(https://www.tensorflow.org/api_docs/python/tf/metrics),我想我可以使用两个单独的二进制分类器并使用TruePositives指标,但是,我更愿意保持简单和在一个模型中获取所有内容。