我一直在读到人们正在根据统计估计来估计 Google+ 人口:
我的模型很简单。我从美国人口普查局关于美国姓氏流行度的数据开始,并将其与每个姓氏的 Google+ 用户数量进行比较。我将美国用户与非美国用户分开。通过使用 100-200 个姓氏的样本,我能够准确估计已注册 Google+ 的美国人口的总百分比。然后我使用该数字和美国与非美国用户的计算比率来生成我的全球估计值。我的比例是每 2.12 个非美国用户对应 1 个美国用户。这个比率是在 7 月 4 日通过艰苦的努力计算出来的,从那以后我就没有更新过。这绝对是我希望尽快解决的模型中的一个弱点。该比率可能会随着时间而改变。
这怎么可能?我看不出固定样本量如何告诉您参与的美国人口百分比。让我们看2个案例:
- 案例 1:有 10,000 个 Google+ 用户
- 案例 2:有 1,000,000 个 Google+ 用户
为什么样本在统计上会不同?