大量的数据进行统计分析就是描述数据集中的趋势,通常通过平均数、中位数和众数三个统计量来描述数据集中趋势。
在日常生活中,我们常用平均数描述一组数据的集中趋势。一般地,对于n个数,这n个数求和后再除以n叫做这n个数的算术平均数,简称平均数。
加权平均数考虑的是当一组数据中有若干个数据多次重复出现时的情况,可以理解算术平均数是加权平均数的特例。
平均数公式
一般地,当一组数据的各个数值都在某个常数附件的时候,可以把各个数据同时减去一个适当的常数,得到一组新数据,这样做的好处是便于数据的计算。
权的常见形式有以下几种:
1、频数形式.如 50、45、55
2、比的形式.如 3:3:2:2.
3、百分比形式.如 30%、30%、20%和20%
中位数的定义:n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
众数的定义:在一组数据中,出现次数最多的数据叫做这组数据的众数。
求中位数的一般步骤:
(1)将这一组数据从大到小(或从小到大)排序
(2)两种情况:
①如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数。
②如果数据的个数是偶数,则处于中间两个数的平均数就是这组数据的中位数。
求众数:不用排序,直接数每个数出现的次数.出现次数最多的就是众数。
需记住中位数和众数的以下特征:
(1)中位数是不一定在这组数据中
(2)众数是一定在这组数据中
(3)众数不一定只有一个
(4) 在一组数据中,中位数是只有一个
平均数、众数及中位数都是数据代表。它们分别从不同角度、不同侧面刻画了一组数据的特征。它们都是描述数据集中趋势的统计量。平均数、中位数和众数的异同点:
平均数、中位数和众数都是描述数据集中趋势的统计量.
① 计算平均数时,所有数据都参加运算,能充分地利用数据所提供的信息,因此在现实生活中较为常用.
② 当一组数据中,出现极端值(某个数据相比较过大或过小)时,平均值受到影响,这时,通常采用中位数来描述数据的集中趋势,它受极端值的影响较小,但不能利用所有的数据的信息.
③ 当一组数据中某些数据多次重复出现时,可以用众数来描述数据的集中趋势,但各个数据的重复次数大致相等时,往往没有特别意义。
在折线统计图中,可以怎样求一组数据的众数、中位数、平均数?
众数:同一水平线上出现次数最多的数据
中位数:折线图上,从上到下(或从下到上)处于中间点所对应的数
平均数:可以用中位数与众数估测平均数。具体计算时可以以这个数为基准用简便算法求平均数
在条形统计图中,可以怎样求一组数据的众数、中位数、平均数呢?
众数:柱子最高的小长方形所对应的数据
中位数:从左到右(或从右到左)找中间数
平均数:可以用中位数与众数估测平均数
在扇形统计图中,可以怎样求一组数据的众数、中位数、平均数?
众数:面积最大的扇形所对应的数据
中位数:扇形图中各数据按大小顺序排列,相应的百分比 第50%、51%两个数据的平均数是中位数
平均数:可以利用加权平均数进行计算。
上面描述的数据的集中趋势,下面我们用统计量描述数据的离散程度。
我们刻画数据离散程度的三个量度,极差、方差和标准差。
极差是指一组数据中最大数据与最小数据的差,极差大,偏离平均数越大,产品的质量(性能)越不稳定。
数学上,数据的离散程度还可以用方差或标准差来刻画。方差是各个数据与平均数之差的平方的平均数, 一般而言,一组数据的极差、方差或标准差越小,这组数据就越稳定. 标准差的单位与已知数据的单位相同,使用时应当标明单位;方差的单位是已知数据单位的平方,使用时可以不标明单位。
标准差是方差的算术平方根。一般而言,一组数据的极差、方差或标准差越小,这组数据就越稳定。
极差的应用多在统计图中考查,要能够准确分析统计图中的量,根据问题进行解答,折线统计图一般能判断数据的稳定性。
利用方差的大小判断数据稳定性的步骤:
①先计算数据的平均数;
②计算方差;
③根据方差大小作出判断