我在使用Apache Pig 排名实用程序时遇到了这个奇怪的问题。我正在执行以下代码:
email_id_ranked = rank email_id;
store email_id_ranked into '/tmp/';
所以,基本上我试图得到以下结果
1,email1
2,email2
3,email3
...
问题是有时猪会转储上述结果,但有时它只会转储没有排名的电子邮件。此外,当我使用函数 pig 在屏幕上转储数据时,会dump返回两列。我不知道问题出在哪里。友善的建议。
如果您需要更多信息,请告诉我。提前致谢。
Pig 版本:Apache Pig 版本 0.11.0-cdh4.6.0