数据如下:
COL1 COL2
12 :402:agsh,hhjd,:45:hghgh,gruru,:12:fgh,ghgh,:22:hhhh
57 :42:agshhhjd,:57:hghgh,gruru,:120:fghghgh,:12:hhhhhh
我正在创建第三列field_info,例如:
COL1 COL2 field_info
12 :402:agsh,hhjd,:45:hghghgruru,:12:fgh,ghgh,:22:hhhh fgh,ghg
57 :42:agshhhjd :57:hghgh,gruru:120:fghghgh :12:hhhhhh hghgh,g
我正在使用如下正则表达式函数:
df.loc[:,'field_info']=df.col2.replace(regex=r'.*'+ df.col1.astype('str') +':(.{15}).*',value="\\1")
我有 2 列 col1 和 col2。col1 有一些值,我在 col2 中动态搜索并从中提取接下来的 15 个字符。但是,这需要很多时间。任何人都可以建议一种更快的方法吗?