中位数与众数

📘 数据的分析·
·定义、应用

🎯 学习目标

  • 理解中位数和众数的定义
  • 能够根据数据计算中位数与众数
  • 能在实际问题中识别并应用中位数与众数

📚 核心概念

在一组数据中,中位数是将所有数据按大小顺序排列后,处于中间位置的那个数。如果数据个数是奇数,中位数就是正中间的那个数;如果是偶数,则中位数是中间两个数的平均值。例如,数据集 1,3,51, 3, 5 的中位数是 33;而 2,4,6,82, 4, 6, 8 的中位数是 (4+6)/2=5(4+6)/2 = 5

众数是一组数据中出现次数最多的数。一组数据可能有一个众数(单峰)、多个众数(多峰),也可能没有众数(所有数据出现次数相同)。例如,数据集 2,3,3,42, 3, 3, 4 的众数是 33;而 1,2,2,3,31, 2, 2, 3, 3 有两个众数:2233;数据 5,6,75, 6, 7 则没有众数。

中位数和众数都是描述数据“集中趋势”的统计量,与平均数一起帮助我们了解数据的整体情况。中位数不受极端值影响,适合描述偏态分布的数据;众数则反映最常见的数值,常用于分类数据。

📝 关键公式

  • 中位数(Median)

    • 若数据个数 nn 为奇数:中位数是第 n+12\frac{n+1}{2} 个数。 示例:数据 [1,2,3][1, 2, 3]n=3n=3,中位数是第 22 个数,即 22
    • nn 为偶数:中位数是第 n2\frac{n}{2} 个与第 n2+1\frac{n}{2}+1 个数的平均值。 示例:数据 [1,2,4,6][1, 2, 4, 6]n=4n=4,中位数是 (2+4)/2=3(2+4)/2 = 3
  • 众数(Mode):出现频次最高的数值。 示例:数据 [5,5,6,7,7,7][5, 5, 6, 7, 7, 7],众数是 77(出现3次)。

💡 经典例题

例题1(基础):求数据集 3,7,1,9,43, 7, 1, 9, 4 的中位数和众数。

  1. 先排序:1,3,4,7,91, 3, 4, 7, 9
  2. 数据个数 n=5n=5(奇数),中位数是第 5+12=3\frac{5+1}{2}=3 个数,即 44
  3. 每个数都只出现1次,因此没有众数

:中位数是 44,没有众数。


例题2(进阶):某班8名学生一周阅读时间(小时)为:2,3,3,4,5,5,5,62, 3, 3, 4, 5, 5, 5, 6。求中位数和众数,并说明哪个更能代表“典型”阅读时间。

  1. 数据已排序,n=8n=8(偶数)。
  2. 中位数是第 44 和第 55 个数的平均值:(4+5)/2=4.5(4 + 5)/2 = 4.5
  3. 各数出现次数:22(1次),33(2次),44(1次),55(3次),66(1次)。出现最多的是 55,所以众数是 55
  4. 因为 55 是最常出现的时间,更能代表“典型”情况,所以众数更合适

:中位数是 4.54.5,众数是 55;众数更能代表典型阅读时间。

⚠️ 易错点

  • 忘记排序就找中位数:中位数必须在数据从小到大排列后才能确定。解决方法:先排序再找中间位置。
  • 误以为众数一定存在:当所有数据出现次数相同时,没有众数。要检查每个数值的频次。
  • 混淆中位数位置公式:奇数个数据时是第 (n+1)/2(n+1)/2 个,不是 n/2n/2。建议用具体例子验证。
  • 多个众数时只写一个:如数据 1,2,2,3,31,2,2,3,3 有两个众数 2233,不能遗漏。
  • 把平均数当成中位数或众数:三者意义不同,需根据问题要求选择合适的统计量。