我是数据科学的新手。我正在尝试使用回归技术编写程序,并且我的所有值都是数字的,但日期和时间 (UTC) 除外,它们以以下格式编写:HH:MM:SS MM/DD/YY。日期和时间是 CSV 文件的一部分,我不知道如何更改该列。我四处寻找如何将其转换为数值,但所有结果都将日期放在时间之前。除此之外,我很难找到改变不止一次约会的人。如果有人可以指导我如何使时间和日期可读(使用 sklearn.linear_model 库中的 LinearRegression().fit()),我将不胜感激。
PS我什至必须将其转换为数字吗?我可以保留它作为日期和时间还是需要转换它?
编辑:
algaeData = pd.read_csv(r'my_file').drop(columns=['Type', 'Device Type', 'Device S/N', 'Mooring', 'MRPT & NOTES'])
algaeData['Date (UTC)'] = pd.to_datetime(algaeData['Date (UTC)'], format='%H:%M:%S %m/%d/%y')
x = algaeData.drop(columns=['BGA (ug/L) (ug/L)'])
y = algaeData['BGA (ug/L) (ug/L)']
x, y = np.array(x), np.array(y)
model = LinearRegression().fit(x, y)