在过去的 6 个月里,我一直在学习数据科学,但是我刚刚在Jean-Nicholas Hould的一篇文章中遇到了Hadley Wickham的整理数据原则。
这完全改变了我对数据处理方式的看法。我不仅应该清理数据,而且还应该正确格式化数据。仔细想想,这似乎很明显,但这不是重点。
我决定开始将这些原则应用到我的数据清理工作流程中,但是,我想知道是否有时拥有整洁的数据并不理想?
我们什么时候不想“整理我们的数据”?
理想情况下,我们什么时候应该使用 Tidy Data,什么时候应该避免它?
您对此的意见将不胜感激。