免费下载数学必修3教研课《2.3.2两个变量的线性相关》PPT课件
以下为幻灯片页面截图,请点击左边“我要下载”按钮免费下载无水印完整文件
2.3 变量间的相关关系
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
1.理解两个变量的相关关系的概念.(重点)
2.会作散点图,并利用散点图判断线性相关关系.(难点)
3.了解最小二乘法的思想及回归方程系数公式的推导.
4.通过实例加强回归直线方程含义的理解,能够对实际问题进行分析和预测.
城门失火殃及池鱼
世界是一个普遍联系的整体,任何事物都与其他事物相联系.
我们曾经研究过两个变量之间的函数关系:一个自变量对应着惟一的一个函数值,这两者之间是一种确定关系.生活中的任何两个变量之间是不是只有确定关系呢?请同学们举例说明.
数学学习与物理学习
商业销售收入与广告之间
粮食产量与施肥量之间
人体脂肪含量与年龄之间
生活中相关成语:
“名师出高徒” , “瑞雪兆丰年”
“强将手下无弱兵” “虎父无犬子”
当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.
例:(1)商品销售收入与广告支出经费之间的关系;
(2)粮食产量与施肥量之间的关系;
(3)人体内脂肪含量与年龄之间的关系.
变量之间的相关关系
相关关系是一种非确定关系
在学校,老师经常对学生这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。这种说法有没有依据呢?
思考
凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素。例如,是否喜欢物理,用在物理学习上的时间等等。当我们主要考虑数学成绩对物理成绩的影响时,就是主要考虑这两者之间的相关关系。
1〉商品销售收入与广告支出经费之间的关系。
商品销售收入与广告支出经费之间有着密切的联系,但商品收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关。
我们还可以举出现实生活中存在的许多相关关系的问题。例如:
在一定范围内,施肥量越大,粮食产量就越高。但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响。
2〉粮食产量与施肥量之间的关系。
在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关。
3〉人体内脂肪含量与年龄之间的关系。
应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”。但是,不管你经验多么丰富如果只凭经验办事,还是很容易出错的。因此,在分析两个变量之间的关系时,我们还需要有一些有说服力的方法。
自变量取值一定时,因变量的取
值带有一定随机性的两个变量之间的关系,叫做相关关系.
变量间相关关系的概念:
相同点:两者均是指两个变量间的关系.
不同点:①函数关系是一种确定的关系;相关关系是一种
非确定的关系.事实上,函数关系是两个非随机变量的关
系,而相关关系是随机变量与随机变量间的关系.
②函数关系是一种因果关系,而相关关系不一定是因果关
系,也可能是伴随关系.
请同学们回忆一下,我们以前是否学过变量间的关系呢?
1.下列关系中,是带有随机性相关关系的是 .
①正方形的边长与面积的关系;②水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生之间的关系.
②③④
2. 下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的余弦值
B. 正方形边长和面积
C.正n边形的边数和它的内角和
D. 人的年龄和身高
D
即学即用
1.下列说法中正确的是( )
(A)任何两个变量都具有相关关系
(B)球的体积和球的半径具有相关关系
(C)农作物的产量和施肥量之间是一种确定关系
(D)某商品的产量和该商品的价格之间是一种非确定关系
解:选D.A的说法是错误的;球的体积和球的半径具有函数关系,故B错误;C中农作物的产量和施肥量之间是一种相关关系,故C错误;D是正确的.
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.
这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
例1 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.
/平方米
售价/万元
正相关
解:
由散点图支持了我们从数据表中得出如下结论:
a. 如果所有的样本点都落在某一函数曲线上,就用 该函数来描述变量之间的关系。
b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。
c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系。
从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。但有的两个变量的相关,如下图所示:
如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。
作出散点图发现,它们散布在从左上角到右下角的区域内。又如汽车的载重和汽车每消耗1升汽油所行使的平均路程,称它们成负相关.
正、负相关、线性相关 概念探究
请同学们观察这4幅图,看有什么特点?
正相关 :从散点图1可以看出因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域
负相关 :从散点图2可以看出因变量随自变量的增大而减小则称作负相关,负相关的散点图中的点分布在左上角到右下角的区域.
无相关性:从散点图3、4可以看出因变量与自变量不具备相关性
小结:两个变量间的相关关系,可以借助散点图直观判断
年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
这些点大致分布在一条直线附近.
回归直线
我们再观察它的图象发现这些点大致分布在一条直线附近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,该直线所对应的方程叫做回归方程.
那么,我们该怎样求出这个回归方程呢?
请同学们展开讨论,能得出哪些具体的方案?
方案1.先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小的位置时,测出它的斜率和截距,得到回归方程.如图:
方案2.在图中选两点作直线,使直线两侧的点的个数基本相同.
方案3.如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距而得到回归方程. 如图:
回归直线
实际上,求回归直线的关键是如何用数学的方法来刻画“从整体上看,各点到此直线的距离小”。
人们经过实践与研究,已经找到了计算回归方程的斜率与截距的一般公式:
以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法
例:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度 -5 0 4 7 12 15 19 23 27 31 36
热饮杯数 156 150 132 128 130 116 104 89 93 76 54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一
般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
三、例题示范,精讲点拨
解: (1)散点图
(2)气温与热饮杯数成负相关,即气温越高, 卖出去的热饮杯数越少。
温度
热饮杯数
列表
(3)
一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?
例2 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.
/℃
130
128
132
150
156
热饮杯数
12
7
4
0
-
5
摄氏温度
130
128
132
150
156
12
7
4
0
-
5
54
76
93
89
104
116
36
31
27
23
19
15
54
76
93
89
104
116
36
31
27
23
19
15
解:(1)散点图如下:
/℃
(2)从散点图看到,各点散布在从左上角到右下角的
区域里,因此,气温与热饮销售杯数之间成负相关,即
气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附
近,因此利用公式求出回归方程的系数.得回归方程.
= -2.352x+147.767
(4)当x=2时, =143.063.因此,某天的气温为2 ℃
时,这天大约可以卖出143杯热饮.
2.已知回归直线的斜率的估计值是1.23,样本点的中心
为(4,5),则回归直线的方程是( )
(A) =1.23x+4 (B) =1.23x+5
(C) =1.23x+0.08 (D) =0.08x+1.23
解:当x=4时,y=1.23×4+0.08=5,故选C.
C
3.已知x,y的取值如下表所示:
如果y与x线性相关,且线性回归方程为 ,则
=( )
(A) (B) (C) (D)
解:∵ 又 ,
B
【思路点拨】本题可先利用公式求出回归直线方程,再求广告费用为6万元时的销售额.
5.为分析初中升学的数学成绩对高一学生学习情况的影响,
在高一年级学生中随机抽取了10名学生,他们的入学成绩与
期末考试成绩如下表:
(1)若变量之间具有线性相关关系,求出回归直线的方程;
(2)若某学生的入学成绩为80分,试估计他的期末成绩.
1.在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作如下判断:
(1)如果所有的样本点都落在某一函数曲线上,变量之间就是函数关系;
(2)如果所有的样本点都落在某一函数曲线的附近,变量之间就有相关关系;
(3)如果所有的样本点都落在某一直线的附近,变量之间就有线性相关关系;
(4)如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系,即两个变量之间是相互独立的.
2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归直线方程.
3.求样本数据的线性回归方程,可按下列步骤进行:
第一步,计算平均数 , ;
第二步,求和 , ;
第三步,计算
第四步,写出回归方程.
追赶时间的人,生活就会宠爱他;放弃时间的人,生活就会冷落他.