论文部分内容阅读
许多问题具有不确定性,例如,掷一枚均匀的硬币,事先并不能说准硬币落地后是哪一面向上的;射击打靶之前,不能确定子弹落在靶上的确切位置;年初时,很难准确地预报某地区全年的降水量,这类问题被称为不确定性问题或随机性问题.
为了研究不确定性问题,更深入地研究已发生的现象和较准确地预测未发生的现象,人们想到了利用统计数据的方法.具有不确定性的对象虽然不好把握,但是人们可以收集与其相关的数据,通过分析这些数据,来发现对象的变化规律,从而作出更接近于客观的估计.这就是统计的作用.
每一个统计过程都是从收集数据起步的,收集到的数据叫做原始数据.虽然原始数据包含了研究对象的大量信息,但是它们往往是初级的、表层的,人们经常要对其加工整理,从中挖掘出更有用的深层信息.在加工整理原始数据时,人们会得到一些能从某个角度反映研究对象的某些特征的数值.常用的平均数、中位数和众数都是反映研究对象的集中趋势的数值,方差则是反映研究对象离散(波动)程度的数值.
一、平均数
在一个具有不确定性的问题中,与研究对象相关的数据可能有大有小.数据的平均数是反映研究对象的平均水平的数值.数据的算术平均数为.这是最简单的平均数,
例l 甲、乙两名选手各射击10次,所取得的成绩如表1所示.试比较每人的单枪平均成绩,并说明其含义.
解析:甲的单枪平均成绩为
从另一个角度看,甲10枪中命中6环2次.7环3次,8环2次,9环1次,10环2次,共5种成绩,所以他的单枪平均成绩也可以如下计算:
用同样的算法可得乙的单枪平均成绩为
由可知,虽然甲、乙两人的成绩不完全相同,但是从单枪平均水平的角度看两人的成绩相同.
一般地,如果一组数据中共有m种不同的值,记它们为并且其中分别叫做的权.数值叫做这组数据的加权平均数,例如,上面的和都是加权平均数.可以看出,这里的加权平均数是算术平均数的一个简化形式,它在计算上会更加简便.
二、中位数
除了用平均数反映对象的平均水平外,还可以用中位数来反映对象的居中水平.
把n个数据从小到大排成一列,相同的数重复进行排列.当n是奇数时,排在正中间位置的一个数,叫做这n个数据的中位数;当n是偶数时,排在中间位置的两个数的平均数,叫做这n个数据的中位数.例如,1,l,2,3,5,6,7这7个数的中位数是3;l,l,2,3,4,5,6,7这8个数的中位数是.中位数体现了一组数据中间位置的数据水平,它反映了具有不确定性的研究对象在中等状态下的水平.
例2 根据表1,比较甲、乙射击成绩的中位数,并说明其含义.
解析:把甲、乙的各次成绩分别从小到大依次排列,得到如下两组数据:
甲 6 6 7 7 7 8 8 9 10 10
乙 7 7 7 7 8 8 8 8
9
9
甲射击成绩的中位数为(7 8)÷2=7.5,乙射击成绩的中位数为(8 8)÷2=8.这说明,在一般情形下,甲发挥到中等水平时成绩约介于7环和8环之间,乙发挥到中等水平时成绩可能为8环.乙的中位数较大,如果两人都是中等水平发挥,乙的成绩略好的可能性要大些.
三、众数
具有不确定性的研究对象,在相同的试验条件下,可能有不同的表现,哪种表现的可能性最大呢?这可以用统计数据的众数来反映,
一组数据中出现的次数最多的数,叫做这组数据的众数.例如,数据1,2,1,3,3,6,4,5,3的众数是3;数据3,1,2,l,5,1,2,3,2的众数是1和2.如果一组数据中各个不同的数出现的次数都相同,则这组数据中不存在众数.众数表现了一组数据的聚集点(或称为“热点”),它反映了具有不确定性的研究对象通常最可能呈现的水平.
例3 根据表1,比较甲、乙射击成绩的众数,并说明其含义.
解析:甲的成绩有5种,其中6环出现2次,7环出现3次,8环出现2次,9环出现1次,10环出现2次.7环出现的次数最多,所以众数是7.
乙的成绩有3种,其中7环出现4次.8环出现4次,9环出现2次,出现次数最多的是7环和8环,所以众数是7和8.
从比较两组数据的众数的角度来看,在一般情形下,甲射中7环比取得其他成绩的可能性要大些,乙射中7环或8环比取得其他成绩的可能性要大些,
一组数据的集中趋势,包括数据的平均水平、居中水平和聚集水平,平均数、中位数和众数分别代表了这三个水平.所以说它们是描述数据的集中趋势的三个代表,
四、方差
考察具有不确定性的对象的特征时,除了从集中趋势的角度研究以外,还可以研究与研究对象相关的数据的变化幅度,即数据的离散程度,从整体上看,如果一组数据的值比较接近,则说这组数据分布得比较紧密,它的离散程度较小;反之,如果一组数据的值差距较大,则说这组数据分布得比较松散,它的离散程度较大,离散程度较小的一组数据,从整体上看各数据偏离平均数的程度较小;离散程度较大的一组数据,从整体上看各数据偏离平均数的程度较大.
为了精确地反映一组数据的离散程度,可以把一组数据中的全部n个数据,的平均数x作为基准,计算各数据与x的差的平方,这些平方的平均数就叫做这组数据的方差.因为方差可以从整体上反映数据偏离平均数的程度,所以它成为了反映研究对象离散程度的数值.
例4 根据表l,比较甲、乙射击成绩的方差,并说明其含义.
解析:从例1可知,甲、乙射击成绩的平均数都是7.8.把甲、乙的各次成绩依次代人下式:得
比较两个方差可以估计:就目前的情况来说,甲射击成绩的离散程度较大.这说明,两人相比甲的表现波动大些,乙相对更稳定些.这可以为选拔选手和制定有针对性的训练计划提供依据.
以上围绕一个射击问题,简单地说明了反映对象特征的四种数值.同学们在学习统计知识时应注意结合一些具体事例去理解它们,要逐步体会统计在实际生活中的应用,而不是仅仅关注一些具体的计算.
为了研究不确定性问题,更深入地研究已发生的现象和较准确地预测未发生的现象,人们想到了利用统计数据的方法.具有不确定性的对象虽然不好把握,但是人们可以收集与其相关的数据,通过分析这些数据,来发现对象的变化规律,从而作出更接近于客观的估计.这就是统计的作用.
每一个统计过程都是从收集数据起步的,收集到的数据叫做原始数据.虽然原始数据包含了研究对象的大量信息,但是它们往往是初级的、表层的,人们经常要对其加工整理,从中挖掘出更有用的深层信息.在加工整理原始数据时,人们会得到一些能从某个角度反映研究对象的某些特征的数值.常用的平均数、中位数和众数都是反映研究对象的集中趋势的数值,方差则是反映研究对象离散(波动)程度的数值.
一、平均数
在一个具有不确定性的问题中,与研究对象相关的数据可能有大有小.数据的平均数是反映研究对象的平均水平的数值.数据的算术平均数为.这是最简单的平均数,
例l 甲、乙两名选手各射击10次,所取得的成绩如表1所示.试比较每人的单枪平均成绩,并说明其含义.
解析:甲的单枪平均成绩为
从另一个角度看,甲10枪中命中6环2次.7环3次,8环2次,9环1次,10环2次,共5种成绩,所以他的单枪平均成绩也可以如下计算:
用同样的算法可得乙的单枪平均成绩为
由可知,虽然甲、乙两人的成绩不完全相同,但是从单枪平均水平的角度看两人的成绩相同.
一般地,如果一组数据中共有m种不同的值,记它们为并且其中分别叫做的权.数值叫做这组数据的加权平均数,例如,上面的和都是加权平均数.可以看出,这里的加权平均数是算术平均数的一个简化形式,它在计算上会更加简便.
二、中位数
除了用平均数反映对象的平均水平外,还可以用中位数来反映对象的居中水平.
把n个数据从小到大排成一列,相同的数重复进行排列.当n是奇数时,排在正中间位置的一个数,叫做这n个数据的中位数;当n是偶数时,排在中间位置的两个数的平均数,叫做这n个数据的中位数.例如,1,l,2,3,5,6,7这7个数的中位数是3;l,l,2,3,4,5,6,7这8个数的中位数是.中位数体现了一组数据中间位置的数据水平,它反映了具有不确定性的研究对象在中等状态下的水平.
例2 根据表1,比较甲、乙射击成绩的中位数,并说明其含义.
解析:把甲、乙的各次成绩分别从小到大依次排列,得到如下两组数据:
甲 6 6 7 7 7 8 8 9 10 10
乙 7 7 7 7 8 8 8 8
9
9
甲射击成绩的中位数为(7 8)÷2=7.5,乙射击成绩的中位数为(8 8)÷2=8.这说明,在一般情形下,甲发挥到中等水平时成绩约介于7环和8环之间,乙发挥到中等水平时成绩可能为8环.乙的中位数较大,如果两人都是中等水平发挥,乙的成绩略好的可能性要大些.
三、众数
具有不确定性的研究对象,在相同的试验条件下,可能有不同的表现,哪种表现的可能性最大呢?这可以用统计数据的众数来反映,
一组数据中出现的次数最多的数,叫做这组数据的众数.例如,数据1,2,1,3,3,6,4,5,3的众数是3;数据3,1,2,l,5,1,2,3,2的众数是1和2.如果一组数据中各个不同的数出现的次数都相同,则这组数据中不存在众数.众数表现了一组数据的聚集点(或称为“热点”),它反映了具有不确定性的研究对象通常最可能呈现的水平.
例3 根据表1,比较甲、乙射击成绩的众数,并说明其含义.
解析:甲的成绩有5种,其中6环出现2次,7环出现3次,8环出现2次,9环出现1次,10环出现2次.7环出现的次数最多,所以众数是7.
乙的成绩有3种,其中7环出现4次.8环出现4次,9环出现2次,出现次数最多的是7环和8环,所以众数是7和8.
从比较两组数据的众数的角度来看,在一般情形下,甲射中7环比取得其他成绩的可能性要大些,乙射中7环或8环比取得其他成绩的可能性要大些,
一组数据的集中趋势,包括数据的平均水平、居中水平和聚集水平,平均数、中位数和众数分别代表了这三个水平.所以说它们是描述数据的集中趋势的三个代表,
四、方差
考察具有不确定性的对象的特征时,除了从集中趋势的角度研究以外,还可以研究与研究对象相关的数据的变化幅度,即数据的离散程度,从整体上看,如果一组数据的值比较接近,则说这组数据分布得比较紧密,它的离散程度较小;反之,如果一组数据的值差距较大,则说这组数据分布得比较松散,它的离散程度较大,离散程度较小的一组数据,从整体上看各数据偏离平均数的程度较小;离散程度较大的一组数据,从整体上看各数据偏离平均数的程度较大.
为了精确地反映一组数据的离散程度,可以把一组数据中的全部n个数据,的平均数x作为基准,计算各数据与x的差的平方,这些平方的平均数就叫做这组数据的方差.因为方差可以从整体上反映数据偏离平均数的程度,所以它成为了反映研究对象离散程度的数值.
例4 根据表l,比较甲、乙射击成绩的方差,并说明其含义.
解析:从例1可知,甲、乙射击成绩的平均数都是7.8.把甲、乙的各次成绩依次代人下式:得
比较两个方差可以估计:就目前的情况来说,甲射击成绩的离散程度较大.这说明,两人相比甲的表现波动大些,乙相对更稳定些.这可以为选拔选手和制定有针对性的训练计划提供依据.
以上围绕一个射击问题,简单地说明了反映对象特征的四种数值.同学们在学习统计知识时应注意结合一些具体事例去理解它们,要逐步体会统计在实际生活中的应用,而不是仅仅关注一些具体的计算.