在python中导入csv数据

数据挖掘 机器学习 Python 数据集 CSV
2022-02-23 12:24:55

我有一个大约 130 列和 6000 行的 csv 文件

将它们导入python的最佳方法是什么,以便我以后可以在分类算法中使用它们(列是标签,行是单个样本)

3个回答

对于小数据,我认为pandas.read_csv是要走的路。

对于“中等”数据,我推荐dask.read_csv

对于大数据,我推荐spark.read.csv

使用熊猫库:

import pandas as pd 
pd.read_csv('foo.csv')

Pandas 自动识别标题,是数据整理的好工具。
10 分钟熊猫简介

您也可以使用 SFrame。首先安装图形实验室然后:

import graphlab as gl
data = gl.SFrame.read_csv('data.csv')

如果你是“铁杆”,你可以使用python 的基本 csv 阅读器,但是你必须自己编写循环来管理数据,所以为什么还要重新发明轮子,只使用 pandas 或 Frame。