在数据分析中,我们不仅关心一组数据的平均数(集中趋势),还关心这些数据彼此之间相差有多大,也就是数据的“波动”或“离散程度”。
方差就是用来衡量这种波动大小的一个重要指标。它的基本思想是:先算出每个数据与平均数的差(叫“偏差”),再把这些偏差平方后求平均。平方是为了避免正负偏差相互抵消。
设有 个数据 ,它们的平均数是 ,那么这组数据的方差记作 ,计算公式为:
因为方差的单位是原数据单位的平方(比如身高单位是厘米,方差单位就是平方厘米),不太直观,所以人们又定义了标准差,它是方差的算术平方根:
标准差和原始数据单位一致,更容易理解。方差或标准差越小,说明数据越集中、越稳定;越大则说明数据越分散、波动越大。
方差公式:
标准差公式:
例题1(基础):某小组5名同学的数学测验成绩为:80, 85, 90, 95, 100。求这组数据的方差和标准差。
解:
例题2(应用):甲、乙两名射击运动员各射靶5次,成绩如下:
解: