我正在尝试运行add_datepart()它将 df 列从 datetime64 转换为许多列
年','月','周','日','Dayofweek','Dayofyear','Ismonthend','Ismonthstart','Isquarterend','Isquarterstart','Isyearend','Isyearstart'。ETC
我使用的是Grocery Sales dataset。我相信的总日期是 125497040。我应该怎么做才能运行这个操作?
每次我运行这段代码。内核死机(内存不足 17.2 GB RAM)
所以我试着把这个数据框分解成更小的部分,然后运行add_datepart,但结果还是一样
我写了这段代码
def add_datepart_large(temp_df, size):
list_df = [temp_df[i:i+size] for i in range(0,temp_df.shape[0],size)]
for i in range(len(list_df)): add_datepart(list_df[i], 'date')
return pd.concat(list_df)
final_df = add_datepart_large(df_all, 100000)
如果在运行此代码后,内核会死掉。怎么了?