这是一个新手问题,所以请多多包涵。给定这个随机森林模型:
from sklearn.ensemble import RandomForestClassifier
X = [ [2,1,1,1], [2,0,2,1], [3,1,1,1] ]
y = [ 0, 1, 2 ]
regr = RandomForestClassifier(n_estimators=200, max_depth=5)
regr.fit(X, y)
X_test = [ [3, 1, 1, 1] ]
y_result = regr.predict_proba(X_test)
print('y_result:' , y_result )
结果是:
y_result: [[0.26 0.05 0.69]]
我知道这些是第一个、第二个和第三个值的概率,或者 0 = 26%、1 = 5% 和 2 = 69%。
问题:如果测试集是[3, 1, 1, 1]并且它适合值2,为什么我得到69%概率2而不是100%?