scikit 学习逻辑回归的输出数据

数据挖掘 Python scikit-学习 逻辑回归 CSV 画面
2022-03-01 18:00:20

我在 python 中使用 scikit learn 运行了逻辑回归。我知道想要将结果输出到 csv 中,然后加载到 Tableau 中。为此,我需要结合 y_test、y_actual 和 X_test 数据。我想知道是否有办法输出 y_test、y_actual 和 X_test 数据?我知道我可以使用 to_csv,但是当我尝试提取这些数据并连接在一起时,我担心它不正确匹配,因为没有识别加入。

或者,有没有办法用逻辑回归保留一个唯一的 id (uid),这样就很容易看到回归对特定人的预测?

1个回答

每条线在预测时都是独立处理的,因此您可以确保数据保持相同的顺序。

为简单起见,您可以将数据保存在 pandas 数据框中。这是一个简短的工作示例:

import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

X, y = make_classification(n_samples=100, n_features=10)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

clf = LogisticRegression()
clf.fit(X_train, y_train)

data_test = pd.DataFrame(data=X_test, columns=['f{}'.format(i) for i in range(1, 11)])
data_test['y_test'] = y_test
data_test['y_pred'] = clf.predict(X_test)