数据挖掘 - scikit 学习逻辑回归的输出数据 - 吾爱随笔录

scikit 学习逻辑回归的输出数据

数据挖掘 Python scikit-学习逻辑回归 CSV 画面

2022-03-01 18:00:20

我在 python 中使用 scikit learn 运行了逻辑回归。我知道想要将结果输出到 csv 中，然后加载到 Tableau 中。为此，我需要结合 y_test、y_actual 和 X_test 数据。我想知道是否有办法输出 y_test、y_actual 和 X_test 数据？我知道我可以使用 to_csv，但是当我尝试提取这些数据并连接在一起时，我担心它不正确匹配，因为没有识别加入。

或者，有没有办法用逻辑回归保留一个唯一的 id (uid)，这样就很容易看到回归对特定人的预测？

1个回答

每条线在预测时都是独立处理的，因此您可以确保数据保持相同的顺序。

为简单起见，您可以将数据保存在 pandas 数据框中。这是一个简短的工作示例：

import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

X, y = make_classification(n_samples=100, n_features=10)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

clf = LogisticRegression()
clf.fit(X_train, y_train)

data_test = pd.DataFrame(data=X_test, columns=['f{}'.format(i) for i in range(1, 11)])
data_test['y_test'] = y_test
data_test['y_pred'] = clf.predict(X_test)

其它你可能感兴趣的问题

上一篇Oracle 11g 是否能够摄取大数据？下一篇如何根据同一年汇总（添加）一列并在 R 中绘制？