CSV 列中的日期时间转换

数据挖掘 Python 数据框 数据格式
2022-03-08 22:12:41

我是数据科学的新手。我正在尝试使用回归技术编写程序,并且我的所有值都是数字的,但日期和时间 (UTC) 除外,它们以以下格式编写:HH:MM:SS MM/DD/YY。日期和时间是 CSV 文件的一部分,我不知道如何更改该列。我四处寻找如何将其转换为数值,但所有结果都将日期放在时间之前。除此之外,我很难找到改变不止一次约会的人。如果有人可以指导我如何使时间和日期可读(使用 sklearn.linear_model 库中的 LinearRegression().fit()),我将不胜感激。

PS我什至必须将其转换为数字吗?我可以保留它作为日期和时间还是需要转换它?

编辑:

algaeData = pd.read_csv(r'my_file').drop(columns=['Type', 'Device Type', 'Device S/N', 'Mooring', 'MRPT & NOTES'])
algaeData['Date (UTC)'] = pd.to_datetime(algaeData['Date (UTC)'], format='%H:%M:%S %m/%d/%y')

x = algaeData.drop(columns=['BGA (ug/L) (ug/L)'])
y = algaeData['BGA (ug/L) (ug/L)']
x, y = np.array(x), np.array(y)

model = LinearRegression().fit(x, y)
1个回答

如果您使用的是熊猫,您可以使用以下方法轻松转换您的列

df['col'] =  pd.to_datetime(df['col'], format='%H:%M:%S %m/%d/%Y')

这会将您的日期读取为 datetime64[ns] 对象。当您使用该预测器拟合您的 LinearRegression 模型时,哪个 sklearn 将能够解析。

虽然我不明白你在说什么

除此之外,我很难找到改变不止一次约会的人。