熊猫 groupby 和排序值

数据挖掘 熊猫 通过...分组
2022-03-12 04:55:42

我正在准备考试,在过去的工作表中遇到了这个问题: 在此处输入图像描述

这是称为“竞赛”的数据框架,其粒度为数学竞赛中每个参赛者提交的每个问题。问题是

在此处输入图像描述 答案是红色的。我明白为什么会这样,但为什么第四个选择是错误的?我真的无法弄清楚 - 请帮忙。

*请让我知道这是否不允许作为该社区的帖子。

有关问题的完整描述:

在这个问题中,我们将查看包含 2019 年数学竞赛数据的竞赛数据框。在竞赛中,每个参与者总共有五个问题。参与者分别提交每个问题,DataFrame 的每一行都记录了某个参与者对其中一位参赛者的特定提交。时间戳列指定参与者提交给定问题的时间;每个时间戳都离散到分钟,并已使用 pd.to datetime 正确转换为 Pandas 日期时间对象。Contestant 列包含每个参与者的 id-name 对。问题列包含提交的问题。正确列告诉我们提交中给出的答案是正确的 (1) 还是不正确的 (0)。假设每个参与者可以针对同一个问题有多个提交,

1个回答

如果参与者在第 1 题之前回答了第 2 题,您将在第 4 个选项中使用 .agg("first") 丢失有关第 1 题的信息