我有个问题。我正在研究欺诈检测领域。我有进口到该国的数据。从标题中可以看出,我有无监督数据。我不知道记录是欺诈性的。但是我知道欺诈行为可能具有的领域知识,并且(走私与)我想随机化一些记录并将它们标记为欺诈行为(有意义的随机性而不是所有功能)。有了这些信息,我想训练我的神经网络来区分欺诈行为。到目前为止我想到的方法:
- 训练,测试拆分
- 在训练数据中,使用随机算法创建欺诈数据 (das, Schneider 2007 APD)
- 在训练数据上训练神经网络
- 在测试数据中,使用随机算法创建欺诈数据 - 这次使用不同的算法(R. Triepels、H. Daniels 和 A. Feelders,“国际航运中的数据驱动欺诈检测”,应用专家系统,第 99 卷,第. 193–202, 2018.)
- 测试模型
我发现了一些类似的方法(从无监督到有监督的欺诈检测,(Ghosh、Anup K. 和 Aaron Schwartzbard。“A Study in Using Neural Networks for Anomaly and Misuse Detection。”USENIX 安全研讨会。第 99 卷。1999 年。)但是我想看更多关于这个主题的论文或论文。任何人对此主题有建议或评论
谢谢