我在 stackexchange 上进行了搜索,发现了一些类似this和this的主题,但它们与我的问题不太相关(或者至少我不知道如何使它们与我的问题相关)。
无论如何,假设我有两组预测结果,如df1和所示df2。
y_truth = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
y_predicted_rank1 = [6, 1, 7, 2, 8, 3, 9, 4, 10, 5]
y_predicted_rank2 = [4, 1, 7, 2, 8, 3, 9, 6, 10, 5]
df1 = pd.DataFrame({'tag': yy_truth, 'predicted_rank': y_predicted_rank1}).sort_values('predicted_rank')
df2 = pd.DataFrame({'tag': yy_truth, 'predicted_rank': y_predicted_rank2}).sort_values('predicted_rank')
print(df1)
# tag predicted_rank
#1 1 1
#3 1 2
#5 1 3
#7 1 4
#9 1 5
#0 0 6
#2 0 7
#4 0 8
#6 0 9
#8 0 10
print(df2)
# tag predicted_rank
#1 1 1
#3 1 2
#5 1 3
#0 0 4
#9 1 5
#7 1 6
#2 0 7
#4 0 8
#6 0 9
#8 0 10
通过查看它们,我知道df1比 更好df2,因为在 中df2,负样本(零)被预测为排名 #4。所以我的问题是,这里可以使用什么度量标准,以便我可以(数学上)判断df1比df2?