登录 / 注册
首页>人教版高中数学必修3>2.2.1用样本的频率分布估计总体分布
  • 资料信息
  • 科目: 

    人教版高中数学必修3 - 2.2.1用样本的频率分布估计总体分布

  • 格式:  PPT
  • 大小:  5.14M    31张
  • 时间:  2016-08

3公开课《2.2.1用样本的频率分布估计总体分布》ppt课件免费下载

以下为幻灯片页面截图,请点击左边“我要下载”按钮免费下载无水印完整文件
3公开课《2.2.1用样本的频率分布估计总体分布》ppt课件免费下载3公开课《2.2.1用样本的频率分布估计总体分布》ppt课件免费下载
2.2 用样本估计总体
用样本的频率分布估计总体分布
(第1课时)
数据
根据样本的情况对总体的相应情况作出估计和推断
3.随机抽样的三种常用方法
简单随机抽样、系统抽样、分层抽样
2.统计学研究问题的步骤
三步骤:收集数据、整理数据、统计推断。即通过抽样方法收集数据的目的是从中寻找所包含的信息,用样本去估计总体。
统计学的核心思想是
复习旧知
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.
情境引入
2000年全国主要城市中缺水情况排在前10位的城市
成都市市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费.
(1)如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
(2)为了较合理地确定这个标准,你认为需要做
哪些工作?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
这些数字告诉我们什么信息?
通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:
很容易发现的是一个居民月平均用水量的最小值时0.2t,最大值是4.3t,其他在0.2t~4.3t之间.

分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.
一幅图胜过千字
(一)从数据中提取信息,
(二)利用图形传递信息。
初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.
下面将要学习的频率分布表和频率分布图,则是从各个
小组数据在样本容量中所占比例大小的角度,来表示数据分布
的规律.
它可以使我们看到整个样本数据的频率分布情况.
频率分布相关概念
频率:样本中某个组的频数和样本容量的比,叫做该数据的频率。
频率分布的表示形式有:
①样本频率分布表
②样本频率分布直方图
③样本频率分布折线图
所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。
频数:在统计学中,将样本按照一定的方法分成若干
组,每组内含有这个样本的个体的数目叫做频数
第一步: 求极差
(一组数据中的最大值与最小值的差).
知识探究(一):样本频率分布表
思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?
0.2~4.3
思考2:分成多少组合适呢?
第二步: 决定组距与组数:
组距:指每个小组的两个端点的距离;
组数:k=极差÷组距,若k为整数,
则组数=k,否则,组数=[k]+1.
将数据分组,当数据在100个以
内时, 按数据多少常分5-12组。
(4.3-0.2)÷0.5=8.2.
将8.2取整
故,可取组距=0.5,组数=9
如果将上述100个数据按组
距为0.5进行分组,那么这
些数据共分为多少组?
第四步:列频率分布表.
计算各小组的频率,作出
下面的频率分布表.
第三步:确定分点,将数据分组.
以组距为0.5将数据分组时,
可以分成以下9组:
[0,0.5),[0.5,1),…,[4,4.5].
知识探究(一):频率分布表
思考3:各组数据的取值范围可以如何设定?
各组均为左闭右开区间,
最后一组是闭区间
思考4:
如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
列频率分布表:
4
8
15
22
25
14
6
4
2
0.04
0.08
0.15
0.22
0.25
0.14
0.06
0.04
100
1.00
0.02
频率分布表一般分五列
1、“分组”,
2、“频数累计(可省),3、“频数”,
4、“频率”,
5、“频率/组距”
最后一行是合计
知识探究(一):频率分布表
频数的合计为样本容量
频率合计为1
为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
月均用水量/t
0.10
0.20
0.30
0.40
0.50
O
频率/组距
0.5
1
1.5
2.5
3.5
4.5
2
3
4
知识探究(二):频率分布直方图
第一步:画平面直角坐标系.
第二步:在横轴上均匀标
出各组分点,在纵轴上
标出单位长度.
第三步:以组距为宽,各组的频率
与组距的商为高,分别画出各组对
应的小长方形.
y轴:频率/组距
x轴:数据单位
月均用水量/t
频率/组距
0.5
0.4
0.3
0.2
0.1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
O
各组的频率在图中哪里显示出来?
各小长方体的面积之和是否为定值?
各小长方形的面积之和为1.
宽度:组距
知识探究(二):频率分布直方图
小长方形的面积=
月均用水量/t
0.5
0.4
0.3
0.2
0.1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
O
你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
频率/组距
知识探究(二):频率分布直方图
(1)居民月均用水量的分布是“山峰”状的,而
且是“单峰”的;
(2)大部分居民的月均用水量集中在一个中间值
附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以0.1和1为组距重新作出的频率分布直方图。
如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
问题:
若将标准a定为2.5,则
74%的居民在2.5t以下
若将标准a定为3,则
88%的居民在3t以下,标准可定为3t.
频率分布直方图如下:
月均用水量/t
0.5
1
1.5
2
2.5
3
3.5
4
4.5
连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.
o
频率/组距
利用样本频率分布对总体分布进行相应估计:
(1)上例的样本容量为100,如果增至1 000,其频率分布直方图的情况会有什么变化?假如增至10 000呢?
(2)样本容量越大,这种估计越精确.
(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.
总体密度曲线
月均用水量/t
a
b
(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比).
o
频率/组距
理论迁移
例 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)估计年龄在32~52岁的知识分子所占的
比例约是多少.
(1)极差为67-28=39,取组距为5,分为8组.
分 组 频数 频率 频率/组距
[27,32)
[32,37)
[37,42)
[42,47)
[47,52)
[52,57)
[57,62)
[62,67]
合 计
样本频率分布表:
3
3
50
9
16
3
0.18
0.06
4
5
7
0.06
0.06
0.32
0.14
0.08
0.10
1.00
0.036
0.012
0.012
0.012
0.064
0.028
0.016
0.020
0.200
(2)样本频率分布直方图:
年龄
0.060
0.050
0.040
0.030
0.020
0.010
27 32 37 42 47 52 57 62 67
O
(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32岁~52岁的知识分子约占70%.
频率/组距
0.06
0.18
0.14
0.32
(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )
(A)18 (B)36 (C)54 (D)72
实战演练
一、求极差,即数据中最大值与最小值的差
二、决定组距与组数 :组距=极差/组数
三、分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间
四、登记频数,计算频率,列出频率分布表
频率分布直方图步骤:
五、画出频率分布直方图(纵轴表示频率/组距)
小结:
频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.
2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
THANK YOU !