登录 / 注册
首页>人教版高中数学必修3>第二章:统计

人教版高中数学必修3精品《第二章:统计复习》PPT课件免费下载

以下为幻灯片页面截图,请点击左边“我要下载”按钮免费下载无水印完整文件
人教版高中数学必修3精品《第二章:统计复习》PPT课件免费下载人教版高中数学必修3精品《第二章:统计复习》PPT课件免费下载人教版高中数学必修3精品《第二章:统计复习》PPT课件免费下载人教版高中数学必修3精品《第二章:统计复习》PPT课件免费下载
复习课
1.下列两变量具有相关关系的是(  )
A.正方体的体积与边长
B.匀速行驶的车辆的行驶距离与时间
C.人的身高与体重
D.人的身高与视力
   A、B均为函数关系,D则无相关关系,选C.
C
2.对两个变量y和x进行回归分析,得到一组样本数据(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是(  )
A.由样本数据得到的回归方程 =bx+a必过点(  )
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系
C
相关指数刻画回归效果,相关指数R2越大,说明模型的拟合效果越好,所以C错误,选C.
  易错点:相关指数R2的功能理解.
3.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
则哪位同学的试验结果体现A、B两变量更强的线性相关性.(  )
A.甲         B.乙
C.丙         D.丁
   因为0.85>0.82>0.78>0.69,由相关系数r的含义知,丁具有更强的线性相关性,选D.
  易错点:残差平方和、相关系数r的区别.残差平方和可以刻画回归效果,相关系数用于判断两变量相关关系的强弱.
D
4.已知回归直线方程为 =0.50x-0.81,则x=25时,y的估计值为    .
    y=0.50×25-0.81=11.69.
11.69
5.下面是一个2×2列联表
则表中a、b处的值分别为(  )
  A.94、96      B.52、50
  C.52、54      D.54、52
    由a+21=73,a+2=b,解得a=52,
b=54,故选C.
    易错点:2×2列联表的意义.
C
1.变量间的相关关系
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种非确定关系.
2.两个变量的线性相关
(1)从散点图上看,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)直线方程为 =bx+a,其中,回归直线系数a,b的值可以由下列公式给出:
(3)通过求        的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.
3.回归分析
(1)在统计中,对具有相关关系的两个变量进行统计分析叫做回归分析.回归分析是寻找相关关系中非确定关系的某种确定性.
(2)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计公式分别为:
其中             称为样本点的中心.
4.独立性检验
  (1)变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量.
  (2)一般地,假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表如下表:
称为2×2列表
(3)利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.其中
重点突破:两个变量的线性相关性、散点图
    某学校5个学生的数学和物理成绩如下表:
判断它们是否有相关关系.
可以以数学成绩为自变量x,考察因变量物理成绩y的变化趋势,作出散点图,从而作出判断.
     以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示:
由散点图可见,图中的点大致在一条直线附近,故两者之间具有相关关系.
另解:

 =80×70+75×66+70×68+65×64 +60×62=23190,
所以,相关系数为
由0.9>0.75知,数学考试成绩和物理考试成绩有显著性的线性相关关系.
变量之间是否具有线性相关性,直观的方法就是作出散点图,如果散点图中的点呈现在一条直线附近,说明两个变量之间具有线性相关.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.另外,利用相关系数进行研究,若相关系数r>0.75,认为两个变量之间具有很强的线性关系.
某某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:
判断y与x之间是否具有相关关系
散点图如下:

由散点图可以看出利润随销售总额的增加而增大,它们之间不仅具有相关关系,而且是正相关.
重点突破:线性回归分析
    一机器可以按各种不同速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多少,随机器运转的速度而变化.下列即为试验结果:
(Ⅰ)求出机器运转速度影响每小时生产有问题物件数的回归直线方程;
(Ⅱ)若实际生产中所允许机器每小时生产的最大问题物件数为10,那么,机器的运转速度不得超过多少转/秒?
   本题已默认“运转速度”与“有问题的物件数”两变量具有线性相关关系,故可以直接根据求回归方程的一般步骤求解.
(Ⅰ)用x表示机器运转速度,y表示每小时生产的有问题的物件数,
则有(x1,y1)=(8,5),(x2,y2)=(12,8),(x3,y3)=(14,9),(x4,y4)=(16,11),

所以回归直线的斜率为
截距
所以回归直线方程为 =0.7286x-0.8575.
(Ⅱ)由 ≤10,得0.7286x-0.8575≤10,
所以x≤14.9013.
即机器的运转速度不能超过14.9013转/秒.
   求出回归直线方程后,往往用来作为观实生产中的变量之间相关关系的近似关系,从而可以用来指导生产实践.
研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:
  (Ⅰ)求y对x的回归直线方程;
  (Ⅱ)预测水深为1.95m时水的流速是多少?
(Ⅰ)作出散点图,如图所示
由散点图可观察到大致在一条直线上,所以可用线性回归方程来拟合它.
所以b≈0.733,

所以y对x的回归直线方程为y=0.6948+0.733x.
(Ⅱ)在本题中回归系数b=0.733的意思是:在此灌溉渠道中,水深每增加0.1 m,水的流速平均增加0.733 m/s,a=0.6948可以解释为水的流速中不受水深影响的部分,把x=1.95代入得到y=0.6948+0.733×1.95≈2.12 m/s,计算结果表明:当水深为1.95 m时可以预报渠水的流速约为2.12 m/s.
重点突破:独立性检验
    下表是某地区的一种传染病与饮用水的调查表:
(Ⅰ)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(Ⅱ)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人,按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.
判断两个分类变量是否有关,可以通过作出等高条形图及K2公式的应用.但从图形上只可以粗略的估计两个分类变量的关系,它不能给我们两个分类变量有关或无关的精确的判断,若要作出精确的判断,可以进行独立性检验的有关计算.本题要求比较两种样本在反映总体时的差异,故应选用K2公式的应用.
(Ⅰ)假设传染病与饮用水无关,由公式计算得:
因此我们有99.9%的把握认为该地区的传染病与饮用水有关.
(Ⅱ)依题意得2×2列联表:
  此时
  所以我们有90%的把握认为该地区的传染病与饮用不干净水有关.
由上可知,两个样本都能得到传染病与饮用不干净的水有关这一相同的结论,但(Ⅰ)问中我们有99.9%的把握肯定结论的正确性,而(Ⅱ)问中我们只有90%的把握肯定结论的正确性.
样本的不同(包括样本容量的不同)可能导致不同的结论,至少影响正确(或不正确)的程度.解答此类题目的关键在于正确利用 
              公式计算K2的
值,再利用临界值的大小关系来判断假设检验是否成立,从而把问题解决.
有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.
已知在全部105人中随机抽取1人为优秀的概率为 .
(Ⅰ)请完成上面的列联表;
(Ⅱ)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”.
(Ⅰ)从全部105人中随机抽取1人为优秀的概率为 ,所以成绩优秀的总人数为 ×105=30,从而可得下表:
(Ⅱ)根据列联表中的数据,得到
因此有95%的把握认为“成绩与班级有关系”.
为了对某市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学(已折算为百分制)、物理、化学分数对应如下表,
(Ⅰ)用变量y与x、z与x的相关系数说明物理与数学、化学与数学的相关程度;
(Ⅱ)求y与x、z与x的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.
参考数据:
相关关系的强弱可以用
回归模型的效果可由相关指数
来描述.
来刻画.
(Ⅰ)变量y与x的相关系数分别是
z与x的相关系数
可以看出,物理与数学、化学与数学的成绩都是高度正相关.
(Ⅱ)设y与x、z与x的线性回归方程分别是

根据所给的数据,可以计算出
所以y与x和z与x的回归方程分别是

又y与x、z与x的相关指数是
故回归模型 =0.65x+34.63比回归模型   =0.72x+25.20的拟合的效果好.
   判定回归模型的拟合效果问题主要是通过总偏差平方和,相关指数R2以及残差分析等方式,前两者是数量定性,而后者是图定性.解答此类问题时,利用相关指数R2来断定相对容易点.
1.求线性回归方程的解题步骤
(1)先把数据制成表,从表中计算出
             的值;
(2)计算回归系数a,b;
(3)写出线性回归方程 =bx+a.
2.两变量相关关系的强弱的判断在尚未断定两个变量之间是否具有线性关系之前,可以画出散点图,借助于图象的直观性加以判断.另

外,可求出相关系数

当 ≥0.75时,相关性很强,当0.3≤ <0.75时,相关性一般,当|r|≤0.25时,相关性较弱.
3.回归模型拟合的效果判断
  (1)利用相关指数R2来刻画回归的效果:

其计算公式是

R2的值越大,表示模型拟合的效果越好.
(2)残差图法:残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高. 
(3)残差平方和法:残差平方和越小,也就是说模型拟合的效果越好.
4.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如:是否存在线性关系,等等).
(3)由经验确定回归方程的类型(如呈线性关系,则运用线性回归方程y=bx+a).
(4)按一定规则估计回归方程中的参数(如最小二乘法).
(5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性,等等),若存在异常,则应检查数据是否有误,或者是选用的模型是否合适.
5.独立性检验的应用步骤:
  根据观测数据计算由公式
                所给出的
检验随机变量K2的观测值k,并且k的值越大,说明“X与Y有关系”成立的可能性越大,可以利用以下数据表来确定“X与Y有关系”的可信程度.
1.(2009·宁夏/海南卷)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(a);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(b).由这两个散点图可以判断(  )
C
A. 变量x与y正相关,u与v正相关
B. 变量x与y正相关,u与v负相关
C. 变量x与y负相关,u与v正相关
D. 变量x与y负相关,u与v负相关
   由图(a)中的数据随着x的增大而减小,因此变量x与y负相关;由图(b)中的数据随着x的增大而增大,因此变量x与y正相关,选C.
本题以散点图为载体,判断两变量是否相关,考查对散点图及其两个变量正相关、负相关的理解,考查数形结合思想.会利用散点图认识变量间的相关关系是新课标考试大纲所要求,要求程度为了解内容,学习时一定要控制难度.
2.(2009·辽宁卷)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
  甲厂:
乙厂:
(Ⅰ)试分析估计两个分厂生产的零件的优质品率;
  (Ⅱ)由于以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
附:
(Ⅰ)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为

  
  乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为
(Ⅱ)
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
本题主要考点为频率分布表与独立性检验,考查应用统计知识,建立数学模型从而解决实际问题的能力.本题以实际问题为背景,将频率分布表及独立性检验两知识点有机结合,难度较小,符合新课标要求.本题的出现,提醒了广大教师及学生,不要凭借以往经验进行“压题”,全面系统的复习考试大纲所要求的所有内容,在夯实基础的同时,真正的高效备考,应是力争做到重点突出.考查平均数、方差等知识与线性回归方程相结合的问题,需要引起重视.