论文部分内容阅读
误区一、不能准确理解相关关系
例1 给出下列关系:
①正方形的边长与面积之间的关系;
②某化妆品的销售量与广告宣传费之间的关系;
③人的体重与视力之间的关系;
④人的年龄与他(她)拥有的财富之间的关系;
⑤水果的产量与气候之间的关系;
⑥名师出高徒.
其中具有相关关系的是 .
错解 ④⑥
分析 变量之间除了函数关系之外,还有相关关系,即从总的变化趋势来看变量之间存在着某种关系,但这种关系又不能用函数关系精确表达出来.两个变量之间产生相关关系的原因是许多不确定的随机因数的影响.由此可判断①②③⑤⑥,对于④,一般来说,在统计中,各年龄对应的财富数据应是这个年龄人群财富的样本平均数,人随着年龄的增长,社会经验、处事能力等都会相应的丰富些,拥有的财富也容易增多,故两者之间具有相关关系.
正解 ②④⑤⑥
误区二、忽略变量间有无相关关系的判断过程
例2 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP/万元)和这一年各城市患白血病的儿童数量,如下表:
判断两个变量是否具有线性相关关系.
错解 ①不画散点图判断而想当然地认为它们具有线性相关关系.②从散点图中可以看出,虽然后5个点大致分布在一条直线的附近,但第1个点离这条直线太远,所以变量之间不具有线性相关关系.
分析 两个变量是否具有相关关系,必须根据散点图判断. 当散点图中的点大致都分布在一条曲线(包括直线)的附近,就可以判断两个变量是具有相关关系的,只有散点图中的点呈条状集中分布在一条直线的附近时,才可以判断两个变量是具有线性相关关系. 点较多时,一两个点偏离主流不影响判断.
正解 由表中数据画出散点图,从图中可以看出,后5个点大致分布在一条直线的附近,可以判断两个变量是具有线性相关关系,可以用相关系数法进一步证明这个结论. 事实上,将数据代入公式可求出其相关系数[r]≈0.90、因为0.90>0.75,所以这两个变量具有线性相关关系,且相关程度很强.
误区三、 忽略线性回归方程中自变量系数[b]的含义
例3 工人工资[y](元)与劳动生产率[x](千元)的相关关系的回归直线方程是[y=80x+50,]下列判断正确的是( )
A.劳动生产率为1千元时,工资为130元
B.劳动生产率提高1千元时,工资水平提高80元
C.劳动生产率提高1千元时,工资水平提高130元
D.当月工资为210元时,劳动生产率为2千元
错解 ACD
分析 在回归直线方程[y]=[bx]+[a]中,[b]的含义是回归直线的斜率. 将[x]的值代入[y]=[80x]+50中,所得的值只是[y]的一个估计值,而不一定是实际取值,故A、D错误,当劳动生产率提高1千元时[△y=(50+80x2)]-[(50+80x1)]=[80(x2-x1)]=[80△x]=80,即工资水平提高80元,故C错误.
例4 关于一组样本数据([x1,y1]),([x2,y2]),…([xn,yn])得到回归直线方程[y]=[bx]+[a],下列说法正确的是 .
①直线[y]=[bx]+[a]必经过点([x],[y]).
②直线[y]=[bx]+[a]至少经过点([x1,y1]),([x2,y2]),…([xn,yn])中的一个点.
③直线[y]=[bx]+[a]和各点([x1,y1]),([x2,y2]),…([xn,yn])的偏差是该坐标平面上所有的直线与这些点的偏差中最小的.
④通过回归直线方程[y]=[bx]+[a],可以估计和预测变量的取值和变化趋势.
⑤回归直线方程[y]=[bx]+[a]最能代表观测值[x、y]之间的关系.
⑥当[x]取样本中的[x0]时,[y]的值大约为[bx0]+[a].
⑦当[x]取样本中的[x0]时,[y]的值一定是大约为[bx0]+[a.]
错解 ②③⑤⑦
分析 对回归直线方程[y]=[bx]+[a],在[y]轴上的截距为[a]=[y]-[b][x],所以回归直线方程可以整理成[y]=[bx]+[a]=[bx]+[y]-[b][x]=[b]([x-x])+[y],故回归直线必经过点([x],[y]),而不一定经过点([x1,y1]),([x2,y2]),…([xn,yn])中的某一个点,故①对②不对,由回归直线方程的推导可知③④对,只有线性回归方程才最能代表观测值[x、y]之间的关系,几乎每一组样本数据都能得到回归直线方程,但若观测值[x、y]之间不是线性相关关系时,该直线的代表性可能会很差,故⑤不对. 线性回归直线方程[y]=[bx]+[a]中的[b]、[a]都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.即使[b]、[a]的估计没有误差,也不能百分之百的保证点[(x,y)]一定落在回归直线上或附近,故⑥对⑦不对.
正解 ①③④⑥
例1 给出下列关系:
①正方形的边长与面积之间的关系;
②某化妆品的销售量与广告宣传费之间的关系;
③人的体重与视力之间的关系;
④人的年龄与他(她)拥有的财富之间的关系;
⑤水果的产量与气候之间的关系;
⑥名师出高徒.
其中具有相关关系的是 .
错解 ④⑥
分析 变量之间除了函数关系之外,还有相关关系,即从总的变化趋势来看变量之间存在着某种关系,但这种关系又不能用函数关系精确表达出来.两个变量之间产生相关关系的原因是许多不确定的随机因数的影响.由此可判断①②③⑤⑥,对于④,一般来说,在统计中,各年龄对应的财富数据应是这个年龄人群财富的样本平均数,人随着年龄的增长,社会经验、处事能力等都会相应的丰富些,拥有的财富也容易增多,故两者之间具有相关关系.
正解 ②④⑤⑥
误区二、忽略变量间有无相关关系的判断过程
例2 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP/万元)和这一年各城市患白血病的儿童数量,如下表:
判断两个变量是否具有线性相关关系.
错解 ①不画散点图判断而想当然地认为它们具有线性相关关系.②从散点图中可以看出,虽然后5个点大致分布在一条直线的附近,但第1个点离这条直线太远,所以变量之间不具有线性相关关系.
分析 两个变量是否具有相关关系,必须根据散点图判断. 当散点图中的点大致都分布在一条曲线(包括直线)的附近,就可以判断两个变量是具有相关关系的,只有散点图中的点呈条状集中分布在一条直线的附近时,才可以判断两个变量是具有线性相关关系. 点较多时,一两个点偏离主流不影响判断.
正解 由表中数据画出散点图,从图中可以看出,后5个点大致分布在一条直线的附近,可以判断两个变量是具有线性相关关系,可以用相关系数法进一步证明这个结论. 事实上,将数据代入公式可求出其相关系数[r]≈0.90、因为0.90>0.75,所以这两个变量具有线性相关关系,且相关程度很强.
误区三、 忽略线性回归方程中自变量系数[b]的含义
例3 工人工资[y](元)与劳动生产率[x](千元)的相关关系的回归直线方程是[y=80x+50,]下列判断正确的是( )
A.劳动生产率为1千元时,工资为130元
B.劳动生产率提高1千元时,工资水平提高80元
C.劳动生产率提高1千元时,工资水平提高130元
D.当月工资为210元时,劳动生产率为2千元
错解 ACD
分析 在回归直线方程[y]=[bx]+[a]中,[b]的含义是回归直线的斜率. 将[x]的值代入[y]=[80x]+50中,所得的值只是[y]的一个估计值,而不一定是实际取值,故A、D错误,当劳动生产率提高1千元时[△y=(50+80x2)]-[(50+80x1)]=[80(x2-x1)]=[80△x]=80,即工资水平提高80元,故C错误.
例4 关于一组样本数据([x1,y1]),([x2,y2]),…([xn,yn])得到回归直线方程[y]=[bx]+[a],下列说法正确的是 .
①直线[y]=[bx]+[a]必经过点([x],[y]).
②直线[y]=[bx]+[a]至少经过点([x1,y1]),([x2,y2]),…([xn,yn])中的一个点.
③直线[y]=[bx]+[a]和各点([x1,y1]),([x2,y2]),…([xn,yn])的偏差是该坐标平面上所有的直线与这些点的偏差中最小的.
④通过回归直线方程[y]=[bx]+[a],可以估计和预测变量的取值和变化趋势.
⑤回归直线方程[y]=[bx]+[a]最能代表观测值[x、y]之间的关系.
⑥当[x]取样本中的[x0]时,[y]的值大约为[bx0]+[a].
⑦当[x]取样本中的[x0]时,[y]的值一定是大约为[bx0]+[a.]
错解 ②③⑤⑦
分析 对回归直线方程[y]=[bx]+[a],在[y]轴上的截距为[a]=[y]-[b][x],所以回归直线方程可以整理成[y]=[bx]+[a]=[bx]+[y]-[b][x]=[b]([x-x])+[y],故回归直线必经过点([x],[y]),而不一定经过点([x1,y1]),([x2,y2]),…([xn,yn])中的某一个点,故①对②不对,由回归直线方程的推导可知③④对,只有线性回归方程才最能代表观测值[x、y]之间的关系,几乎每一组样本数据都能得到回归直线方程,但若观测值[x、y]之间不是线性相关关系时,该直线的代表性可能会很差,故⑤不对. 线性回归直线方程[y]=[bx]+[a]中的[b]、[a]都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.即使[b]、[a]的估计没有误差,也不能百分之百的保证点[(x,y)]一定落在回归直线上或附近,故⑥对⑦不对.
正解 ①③④⑥