如何应用 groupby 滚动函数在数据框中创建多个列

数据挖掘 机器学习 Python 时间序列 熊猫 麻木的
2022-03-05 22:40:51

我正在对股票数据设置一个卷配置文件系列。我已经从这个 github repo实现了市场概况代码,数据链接在这里示例在这里一些数据样本在这里:

Timestamp          Close    High    Low     Open    Volume
2017-09-27 06:30:00 927.74  927.74  927.74  927.74  14929
2017-09-27 07:00:00 933.0   935.53  928.47  928.745 136776
2017-09-27 07:30:00 932.365 934.0   930.065 932.98  73146
2017-09-27 08:00:00 932.39  933.14  930.3   932.45  56624
2017-09-27 08:30:00 934.8675 935.62 931.1495 932.15 74960
2017-09-27 09:00:00 934.325 935.96  933.6 935.2308  62358
2017-09-27 09:30:00 935.48  935.7   933.56  934.36  45043
2017-09-27 10:00:00 935.5   935.56  933.71  935.385 32434
2017-09-27 10:30:00 935.96  936.86  935.21  935.5   58203

在这里,作者通过将函数应用于索引行的切片来获取输出,并通过应用以下代码来应用主函数:

mp = MarketProfile(df, tick_size=1)
mp_slice = mp[df.index.max() - pd.Timedelta(13, 'H'):df.index.max()]

在这里,该函数从整个数据帧中获取一个索引切片并将其函数应用到该切片中,作者通过以下代码得到他的结果:

mp_slice.as_dict()

我想要的是制作rolling(w)索引并将该函数应用于索引熊猫中的整个数据框,并从开始日期开始在数据框中创建新列。df['poc_price']df['value_area'], df[initail_balane'].etc。(包括在 as_dict() 函数输出中的所有内容)。

我尝试了很多代码,但没有得到我想要的最终输出。我最少的代码是:

def make_marketprofile(df, window=50, mode='vol', tick_size=1):
for i in range (0, df.shape[0] - window - 1):
    try:
        mpt = MarketProfile(df[i:i+window], mode=mode, tick_size=0.5)
        mpt_slice = mpt[df[i:i+window].index.min() : 
                    df[i:i+window].index.max()].as_dict()
    except KeyError:
        print('error: {}'.format(df_1['Date'][i+window]))
#        for key, value in mpt_slice():
    df.iloc[i+window] = mpt_slice #value
    try:
         df.drop(['Date'], axis = 1, inplace = True)
    except AttributeError:
         pass
for column in df:
    df[column][1:] = pd.to_numeric(df[column][1:])
    df = df.iloc[window:]
    df.fillna(method = 'ffill', inplace = True)
return df

但它会引发值错误:

ValueError: Must have equal len keys and value when setting with an iterable
0个回答
没有发现任何回复~