r中的训练和测试误差曲线插入符号包

数据挖掘 机器学习 r 预测建模 表现 训练
2022-03-10 00:29:33

我正在运行以下模型

  1. 逻辑回归
  2. 决策树
  3. 支持向量机
  4. 朴素贝叶斯
  5. 随机森林在同一数据集上。

我在 r 中使用 Caret 包。

绘制训练误差和测试误差曲线是我的梦想,我知道这些图

非常漂亮以及使用插入符号的其他性能测量曲线

包,任何帮助将不胜感激。

1个回答

在这里,我们正在为给定模型创建数据。

此代码片段的主要优点是您可以看到模型在不同大小的训练集上的表现。学习曲线数据函数可以[6.0-7.1 version of caret][1]. 当然,学习曲线在机器学习中很有用,原因有几个,包括算法比较、选择模型参数、优化、用于训练的正确数据大小。

set.seed(1412)
class_dat <- twoClassSim(1000)

set.seed(29510)
lda_data <- learing_curve_dat(dat = class_dat, 
                               outcome = "Class",
                               test_prop = 1/4, 
                               ## `train` arguments:
                               method = "lda", 
                               metric = "ROC",
                               trControl = trainControl(classProbs = TRUE, 
                                                        summaryFunction = twoClassSummary))


ggplot(lda_data, aes(x = Training_Size, y = ROC, color = Data)) + 
geom_smooth(method = loess, span = .8) + 
theme_bw()