免费下载高中数学必修3优质课《第二章:统计复习》ppt课件
以下为幻灯片页面截图,请点击左边“我要下载”按钮免费下载无水印完整文件
第二章 统计复习
人教A版必修③
本章回顾
本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.
总体
抽样
分析
估计
简单随机抽样
系 统 抽 样
分 层 抽 样
样 本 分 布
样 本 特 征 数
总 体 分 布
总 体 特 征 数
当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程.而用样本估计总体就是统计思想的本质.
要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率直方图、频率折线图或茎叶图表示后,蕴含于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.
对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.
总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计.
说明:
1.抽样公平性原则—等概率—随机性;
2.抽签法适用与总体中个数N不大的情形.
1.将总体中的所有个体编号(号码可以从1到 N);
2.将1到N 这N 个号码写在形状、大小相同的号签上
(号签可以用小球、卡片、纸条等制作);
3.将号签放在同一箱中,并搅拌均匀;
4.从箱中每次抽出1个号签,并记录其编号,连续抽取k次;
5.从总体中将与抽到的签的编号相一致的个体取出.
2.1 抽样方法
1.简单随机抽样
(1)抽签法
例题——1 系统抽样(等距抽样)
例子. 为了解高一年级500名同学的视力情况,试用系统抽样从中抽取50名同学进行检查。
S1:把500人从1到500编号;
S3:在第一段1~10号中用的 的方法
抽取一个号码,比如3;
S4:依次抽取 ……这50个号码。
这样就得到了一个容量为50的样本。
S2:计算分段间隔为 k= 人。把编号从小
到大依次分成 段,每段 人;
编号
分段
定首号
取余号
50
10
简单随机抽样
3,13,23,33,
2.1 抽样方法
(2).随机数表法:
将总体中的N个个体编号时可以从0开始,例如当N=100时,
编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位
数字号码表示,便于使用随机数表.
当随机地选定开始的数后,读数的方向可以向右,也可以向
左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
(1)对总体中的个体进行编号(每个号码位数一致);
(2)在随机数表中任选一个数作为开始;
(3)从选定的数开始按一定的方向读下去,得到的数码
若不在编号中,则跳过;若在编号中,则取出;如果得到
的号码前面已经取出,也跳过;如此继续下去,直到取满
为止;
(4)根据选定的号码抽取样本.
将总体中的N个个体编号时可以从0开始,例如当N=100时,
编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位
数字号码表示,便于使用随机数表.
当随机地选定开始的数后,读数的方向可以向右,也可以向
左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
(1)对总体中的个体进行编号(每个号码位数一致);
(2)在随机数表中任选一个数作为开始;
(3)从选定的数开始按一定的方向读下去,得到的数码
若不在编号中,则跳过;若在编号中,则取出;如果得到
的号码前面已经取出,也跳过;如此继续下去,直到取满
为止;
(4)根据选定的号码抽取样本.
例子:
下面我们用随机数表法求解本节开头的问题.
(1)对50个同学进行编号,编号分别为01,02,03,…,50;
(2)在随机数表中随机地确定一个数作为开始,如第8行第29列的数7开始.为便于说明,我们将附表中的第6行至第10行摘录如下:
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
第29列
第8行
(3)从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到
12,07,44,39,38,33,21,34,29,42
这10个号码,就是所要抽取的10个样本个体的号码.
小结:
1.抽样无放回;
2.抽样公平性;
3.抽签法,随机数表法—简单的随机抽样.
系统抽样的步骤为:
(1)采用随机的方式将总体中的个体编号;
(2)将整个的编号按一定的间隔(设为k)分段,当 (N为总体中的个体数,n为样本容量)是整数时,k= ;当 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n 整除,这时k= ,并将剩下的总体重新编号;
(3)在第一段中用简单随机抽样确定起始的个体编号l ;
(4)将编号为l , l +k,l +2k,…, l +(n-1)k的个体抽出.
2.系统抽样:
第四步 将编号为
, +10, +20, …, +610 的个体抽出,组成样本.
第三步 在第一段000,001,002,…,009这十个编号中用简单随机抽样确定起始号码 ;
因为624的10%约为62,624不能被62整除,为了保证“等距”分段,应先剔除4人.
例; 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查.如何采用系统抽样方法完成这一抽样?
分析:
第一步 将624名职工用随机方式进行编号;
解:
第二步 从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;
小结:
1.适用与总体中个体无明显的层次差异;
2.系统抽样—等距抽样.
一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样(stratified sampling),其中所分成的各个部分称为“层”.
分层抽样的步骤是:
(1)将总体按一定标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
(4)在每一层进行抽样(可用简单随机抽样或系统抽样).
3.分层抽样
例 某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为1200人,其中持各种态度的人数如下表所示:
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?
分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥.
说明:
1.适用与总体中个体有明显的层次差异,层次
分明的特点;
2.总体中个体数 N较大时,系统抽样,分层抽样
二者选其一.
以上我们学习了三种抽样方法,这些抽样方法的特点及适用范围可归纳如下:
1.现有以下两项调查:①某装订厂平均每
小时大约装订图书362册,要求检验员每
小时抽取40册图书, 检查其装订质量状况;
②某市有大型、中型与小型的商店共1500
家, 三者数量之比为1∶5∶9.为了调查全
市商店每日零售额情况,抽取其中15家进
行调查. 完成①、②这两项调查宜采用的
抽样方法依次是 ( )
A、简单随机抽样法,分层抽样法
B、分层抽样法,简单随机抽样法
C、分层抽样法,系统抽样法
D、系统抽样法,分层抽样法
D
2.要从已编号(1~60)的60枚最新
研制的某型导弹中随机抽取6枚来进
行发射试验, 用每部分选取的号码间
隔一样的系统抽样方法确定所选取
的6枚导弹的编号可能是 ( )
A.5,10,15,20,25,30
B.3,13,23,33,43,53
C.1,2,3,4,5,6
D.2,8,14,20,26,32
B
3.某校有行政人员、教学人员和教辅
人员共200人,其中教学人员与教辅
人员的比为101,行政人员有24人,
现采取分层抽样容量为50的样本,那
么行政人员应抽取的人数为 ( )
A 3 B 4 C 6 D 8
C
教学人员和教辅人员应抽取的人数
分别为_____和_____.
40
4
用样本估计总体
1.作样本频率分布直方图的步骤:
(1)求极差;
(2)决定组距与组数; (组数=极差/组距)
(3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。
例子: 2009年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取100展位的成交额(万元),制成如下频率分布表和频率分布直方图:
1
5
36
50
0.50
0.05
100
频率/组距
0.002
150 170 190 210 230 250
万元
0.36
0.002
0.0025
0.018
0.025
0.0025
例子: 2009年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取若干展位的成交额(万元),制成如下频率分布表和频率分布直方图:
频率/组距
0.002
150 170 190 210 230 250
万元
(2)中位数;
(3)平均数;
最高矩形区间中点
面积相等(概率0.5)
区间中点与相应概率之积的和
220万元
212万元
209.4万元
小结:
1.频率直方图中矩形条的面积=
组距=频率;
2.频率分布表 频率直方图 后者更直观
形象地反映样本的分布规律.
2.3 总体特征数的估计
1.平均数
2.方差,标准差
设一组样本数据 ,其平均数为 ,则称
为这个样本的方差,其算术平方根
为样本的标准差,分别简称样本方差、样本标准差.
小结:
1.方差,标准差是用来刻画样本的稳定性;
2.比较的标准——越小越好。
例:甲、乙两种冬水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2 ),试根据这组数据估计哪一种水稻品种的产量比较稳定.
11.69
7.小王记录了产量x(吨)和能耗y(吨标准煤)对应的四组数据,用最小二乘法求出了 ,不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断这个数据应该是多少?
思考:您如何判断 x 与 y 成线性相关关系?
思考:您认为小王求出的线性回归直线方程对吗?
思考:如果原来100吨产品的能耗为90吨煤;试预测现在的能耗比技术改造前降低了多少吨煤?
解:
由系数公式可知,
C
4.三点(3,10),(7,20),(11,24)的
线性回归方程是 ( )
D