有哪些不同类型的平均值?

机器算法验证 数理统计 平均类型
2022-03-20 11:28:24
  1. 我知道统计中有三种平均方法:MeanModeMedian统计学家是否使用任何其他类型的平均方法?

  2. 我如何知道哪种方法最适合特定的数据集?

4个回答

对于有几何头脑的人来说,有一些基于数据单调变换的方法。

随机变量的几何平均值定义为

G.M.(X)=exp(ΩXlog(x)dfx).

这在处理已知呈指数增长的事物(例如收入、细菌菌落、疾病进展等)方面非常出色。对数变换在生物统计学中如此受欢迎的原因之一是它们能够通过回归估计几何平均值楷模。

随机变量的调和平均值定义为

H.M.(X)=(ΩXx1dfx)1.

这非常适合估计事件、任务或事件在分子中的平均速率,以及在分母中的人员时间度量。对于健康规划或企业合并,您可能有兴趣配备临时医生,在 3 家收购的社区医院之间穿梭,为特定的 MRSA 突破提供服务。在不同地点之间旅行,您需要在各个医院及其协议中共同平均每个任务的时间。调和平均值告诉你。

  1. 您没有提到的一种流行的平均值是修剪平均值(例如 Wilcox,2010 年推荐),我认为它是平均值和中位数之间的中间道路。您可以通过首先丢弃 样本下部和上部的可以是 10。所得平均值对于异常值通常比意思是。nn

  2. 如果您的数据看起来呈正态分布(或通常呈堆形),则平均值可以很好地描述数据的总体趋势。如果数据有偏差,那么中值或修剪后的平均值通常可以更好地描述总体趋势。

参考

威尔科克斯,RR (2010)。现代统计方法的基础知识:大幅提高功效和准确性,Springer,第 2 版。

关于在您列出的三种平均值中进行选择,通常认为平均值适用于连续等区间数据,中位数适用于序数数据,众数适用于名义数据。然而,这个方案非常有限。查看which-mean-to-use-and-when以了解有关该主题的更复杂的想法。

一些相关文献:

穆里埃、彼得罗和乔瓦尼·帕玛强尼。1993. 1930 年代的效用和手段。统计科学 8:421-32。

..对大约一个世纪以来关于该主题的思想进行了广泛的回顾,从 1920 年代开始,从 Kolmogorov 的公理化方法开始,Chisini 的见解,通过决策理论和其他发展。一个好的和彻底的学术审查。

许多相同的见解简明扼要地在:

德卡瓦略,米歇尔。2016. 意思是,你是什么意思?美国统计学家 70:270。

对于精心设计和呈现、简短且易于理解的文章,以下内容非常好(例如,这将是对有才华的学生的理想激励):

Falk、Ruma、Avital Lann 和 Shmuel Zamir。2005. 平均减速带:平均速度的四种观点。机会 18:25-32。

对于那些想要完整而密集的数学处理的人 - 真的只对数学家说实话 - 这个由两部分组成的评论将是一个好的开始:

Grabisch、Michel、Jean-Luc Marichal、Radko Mesiar 和 Endre Pap。2011a。聚合函数:手段。信息科学 181:1-22。

Grabisch、Michel、Jean-Luc Marichal、Radko Mesiar 和 Endre Pap。2011b。聚合函数:构造方法、连接类、析取类和混合类。信息科学 181:23-43。