我有 2 个熊猫数据集,它们有共同的“RF”字段。optionsdata变量为~60K,最多映射到5K的字段histdata。使用np.where速度非常慢:
for j in range(0,len(optionsdata)):
optionsmap[j] = np.where(histdata.ix['RF'].str.match(optionsdata.RF[j]))[0][0]
有没有更快的方法来做到这一点?我需要的只是每个值的行#,optionsdata其中每个值对应于histdata.
我应该注意比较的字段是一个字符串,例如 'NYMEX_01_MAR_2016'