python - 如何为python中上一列中的每个项目按一列分组并从另一列计算频率?

数据挖掘 Python 计数 通过...分组
2022-02-16 10:42:29

我正在尝试按“ID”列对我的数据进行分组。然后我想计算每个“ID”的“序列”频率。这是数据框的示例:

ID     Sequence
101    1-2
101    3-1
101    1-2
102    4-6
102    7-8
102    4-6
102    4-6
103    1118-69
104    1-2
104    1-2

我正在寻找与以下相同的计数:

ID   Sequence   Count
101    1-2        2   
       3-1        1
102    4-6        3
       7-8        1
103    1118-69    1
104    1-2        2

我在python中尝试了这段代码,它没有给我我想要的

df.groupby('ID') 块引用

df.groupby('Sequence').count()

1个回答

这个简单的代码有效:

Count_sequence = df.groupby(['ID','Sequence']).count()

要在 excel 工作表中获取输出:

Count_sequence.to_excel('sequence_count.xlsx)