我有一组游戏事件数据。我们的目标之一是提供一个人玩了多少时间的图片。这听起来很简单,但事实上事件经常被丢弃并导致事件之间的大量时间。
我们现在正在进行现场试验,没有大量数据可用作参考。
尽管我是一名称职的程序员,但我在静力学方面没有太多经验。我的问题是:我可以做些什么来解释丢失的数据?如何确保这些丢失的事件不会扭曲我的数据?
我有一组游戏事件数据。我们的目标之一是提供一个人玩了多少时间的图片。这听起来很简单,但事实上事件经常被丢弃并导致事件之间的大量时间。
我们现在正在进行现场试验,没有大量数据可用作参考。
尽管我是一名称职的程序员,但我在静力学方面没有太多经验。我的问题是:我可以做些什么来解释丢失的数据?如何确保这些丢失的事件不会扭曲我的数据?
您所描述的是,您希望以一种对总体进行建模以服务于更好目的的方式来考虑观察值的分布。
我建议阅读如何转换不同类型的分布,以便您的模型可能获得更高的分数。
就您在分析数据集期间的绘图而言,我会考虑以不同频率重新采样,这将改变绘图的外观并允许您识别季节性问题,例如帐户活动的中断。
如果由于该人根本不活跃而缺少观察结果,那么这很好地代表了现实,问题可能是您将如何提高用户参与度?