离中趋势是指数据分布中各变量值背离中心值的倾向。如果说集中趋势是数据分布同质性的体现,那么离中趋势就是数据分布变异性的体现。对离中趋势的描述,就是要反映数据分布中各变量值远离中心值的程度,主要用变异指标来反映。
变异指标是反映总体各单位变量值之间变异程度的综合指标,即反映数据分布中各变量值远离中心值程度的指标。因此,变异指标不仅可以综合地显示变量值的离中趋势,说明数据的离散程度,还可以用来判别平均数的代表性。平均指标反映总体的一般水平,可以说明数据的集中趋势,但它本身无法说明其代表性的大小。变异指标则正好可以弥补这一缺点,它可以说明平均数代表性的大小,说明数据的离散程度。一般来说,变异指标越小,说明数据离散程度越小,平均数的代表性就越大;变异指标越大,说明数据离散程度越大,平均数的代表性就越小。
常用的变异指标有四分位差、全距、标准差、标准分和离散系数。
全距
全距又称极差,它是总体中某变量值的最大值与最小值之差,用 R 表示。其计算公式为
R = x max -x min
全距可以说明总体中数据变动的范围。全距越大,说明总体中数据变动的范围越大,从而说明总体中数据的差异越大;全距越小,说明总体中数据变动的范围越小,从而说明总体中数据的差异越小。
例4-9 从两个班级中各随机抽取10位同学,其成绩数据如下(单位:分)。
甲班级:60 65 70 72 75 76 78 80 82 85
乙班级:40 55 65 70 73 75 83 85 90 95
试比较两个班级的平均成绩,说明成绩的差异程度。
解: 首先,计算两个班级的样本平均成绩,甲班为74.3分,乙班为73.1分,两个班级的平均成绩相差不是很大。其次,从全距看,甲班的全距为25分,乙班的全距为55分,因此,乙班的成绩差异大于甲班。总体来说,甲班的成绩比较稳定,其平均数的代表性比乙班要好。
若根据组距分组数据计算全距,可用数列中最高一组的上限减去最低一组的下限求得全距的近似值。
全距测定数据变异程度的优点是计算简单,但由于它取决于总体中两个极端数值的差距,与数据数列的其他数值无关,其提供的信息是不全面的,因而不能全面反映数据的离散程度。如果极端数值相差较大而中间数值分布比较均匀,全距便不能确切反映其离散程度。