我使用参考多边形从中获取像素值。提取的像素值在数据框中,但一行代表单个像素的提取值。在分类中,我需要按类(树、草地等)将数据集分成测试(50%)和训练(50% )
我知道如何根据类拆分一组。但是,我希望为一个多边形提取的值分配给一组(训练或测试)并且它们没有混合
为此,我想使用多边形 ID(对象标识)。我想使用 createDataPartition 函数来做到这一点。这些只是两个示例类(还有更多)
这是带有提取值的表的一部分:
"band_1" "band_2" "band_3" "CLASS" "Id"
110 134 119 "tree" 1
112 133 118 "tree" 1
105 125 110 "tree" 2
112 132 117 "tree" 2
109 125 115 "meadow" 6
93 110 101 "meadow" 6
86 106 95 "meadow" 7
105 136 116 "meadow" 7
102 128 111 "meadow" 8
108 129 115 "meadow" 8
113 134 119 "meadow" 8
这是代码:
trainIndeks <- caret::createDataPartition(EXTRACTED$CLASS, p = 0.5, list=FALSE, times = 1)
dataTrain <- EXTRACTED[trainIndeks,]
dataTest <- EXTRACTED[-trainIndeks,]