第三章统计案例导单
详细内容
3.1.1回归分析的基本思想及其初步应用课前预习学案
一、预习目标
通过截距 与斜率 分别是使 取最小值时,求 的值。
二、预习内容:
1.对于一组具有线性相关关系的数据 其回归直线方程的截距和斜率的最小二乘法估计公式:
= , =
2. = , =
3.样本点的中心
三、提出问题
如何使 值最小,通过观察分析式子进行试探推到
课内探究学案
一、学习目标
1.了解回归分析的基本思想和方法 , 培养学生观察分析计算的能力
二、学习重难点
学习重点:回归方程
学习难点: 公式的推到
三、学习过程
1.使 值最小时, 值的推到
2.结论
3. 中 的含义是什么
4. 一定通过回归方程吗?
四、典型例题
例1.研究某灌溉倒水的流速y与水深x之间的关系,测得一组数据如下:
水深x(m)1.401.501.601.701.801.902.002.10
流速y(m/s)1.701.791.881.952.032.102.162.21
(1)求y与x的回归直线方程; (2) 预测水深为1.95m时水的流速是多少?
分析:(1)y与x的回归直线方程为
(2)当水深为1.95m时,可以预测水的流速约为2.12m/s
五、当堂练习
1.对两个变量y和x进行回归分析,得到一组样本数据: 则下列说法不正确的是( )
A.由样本数据得到的回归方程 必过样本中心 B.残差平方和越小的模型,拟合的效果越好
C.用相关指数 来刻画回归效果, 越小,说明模型的拟合效果越好
D.若变量y与x之间的相关系数 ,则变量y与x之间具有线性相关关系
2.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:
年份19851986198719881989199019911992
x(kg)7074807885929095
y(t)5.16.06.87.89.010.210.012.0
年份1993199419951996199719981999
x(kg)92108115123130138145
y(t)11.511.011.812.212.512.813.0
若x与y之间线性相关,求蔬菜年平均产量y与使用氮肥量x之间的回归直线方程,并估计每单位面积蔬菜的年平均产量.(已知 )
六 课后练习与提高
1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x3456
y2.5344.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值: )
解:(1)由题设所给数据,可得散点图如下图
2. 某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元)4235
销售额y(万元)492639[ 54
根据上表可得回归方程 中的 为9.4,据此模型预报广告费用为6万元时销售额为[((9(((((A)63.6万元 (B)65.5万元 (C)67.7万元 (D)72.0万元
3.1.2回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用
课前预习学案
一、预习目标
1 了解相关系数r和相关指数R2
二、预习内容
1 相关系数r
①
②r>0表明两个变量 ;r<0表明两个变量 ;r的绝对值越接近1,表明两个变量相关性 ,r的绝对值越接近0,表示两个变量之间 当r的绝对值大于 认为两个变量具有很强的相关性关系。
课内探究学习
一、学习目标
1 了解相关系数和相关指数的关系.
2 理解随机误差产生的原因.3
3 会进行简单的残差分析
二、学习重难点
学习重点 1 相关系数r 2相关指数R2 3 随机误差
学习难点 残差分析的应用
三、学习过程
1. 相关系数r=
2. r的性质:
四、典型例题
例 随着我国经济的快速发展,城乡居民的审核水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下:
家庭编号12345678910
x收入(千元)0.81.11.31.51.51.82.02.22.42.8
y支出千元0.71.01.21.01.31.51.31.72.02.5
(1)判断家庭平均收入与月平均生活支出是否相关?
(2)若二者线性相关,求回归直线方程。
思路点拨:利用散点图观察收入x和支出y是否线性相关,若呈现线性相关关系,可利用公式来求出回归系数,然后获得回归直线方程。
解:作散点图
观察发现各个数据对应的点都在一条直线附近,所以二者呈现线性相关关系。
(2)
所以回归方程
五、当堂练习
1 山东鲁洁棉业公式的可按人员在7块并排形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg)
施化肥量x15202530354045
产量y330345365405445450455
(1)画出散点图;
(2)判断是否具有相关关系
思路点拨 (1)散点图如图所示
(2)由散点图可知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.
六、课后练习与提高
1 在对两个变量x、y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;②收集数据 ;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图。如果根据可靠性要求能够作出变量x、y具有线性相关结论,则在下列操作顺序中正确的是( )
A ①②⑤③④ B ③②④⑤① C ②④③①⑤ D ②⑤④③①
2 三点(3,10),(7,20),(11,24)的线性回归方程为( )
A B C D
3 对有线性相关关系的两个变量建立的回归直线方程 中,回归系数b ( )
A.可以大于0 B 大于0 C 能等于0 D只能小于0
4 废品率 和每吨生铁成本y(元)之间的回归直线方程为 ,表明( )
A 废品率每增加 ,生铁成本增加258元; B废品率每增加 ,生铁成本增加2元;
C废品率每增加 ,生铁成本每吨增加2元;D废品率不变,生铁成本增加256元;
3.2.1独立性检验的基本思想及其初步应用
金台高中高二数学组 编制:卢军科 审核:何小荣
课前预习
阅读教材P91-P95,了解相关概念,如:分类变量、列联表、独立性检验。
学习目标
(1)通过对典型案例的探究,了解独立性检验(只要求 列联表)的基本思想、方法及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法。
学习重点:独立性检验的基本方法
学习难点:基本思想的领会
学习过程
一、情境引入
5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”?
二、学生活动
【自主学习】
(1)将上述数据用下表(一)来表示:
不患肺癌患肺癌总计
不吸烟
吸烟
总计
(2)估计吸烟者与不吸烟者患肺癌的可能性差异:
在不吸烟者中患肺癌的人约占多大比例? ;
在吸烟的人中患肺癌的人约占多大比例? 。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大?
【合作探究】
1、观察、分析样本数据的列联表和柱形图、条形图,你能得出什么结论?
2、该结论能否推广到总体呢?
3、假设 :患肺癌与吸烟没有关系。则两事件发生的概率有何关系?
不患肺癌患肺癌总计
不吸烟aba+b
吸烟cdc+d
总计a+cb+da+b+c+d
试用上表(二)中字母表示两概率及其关系,并化简该式。你能得到何结论?
4、构造随机变量 (其中 ),结合3中结论,若 成立,则K2应该很 (大、小)
根据表(一)中的数据,利用4中公式,计算出K2的观测值,该值说明什么?(统计学中有明确的结论,在 成立的情况下,P(K2≥6.635)≈0.01。)
5、结合表(二)和三维柱形图、二维条形图如何判断两个分类变量是否有关系?利用独立性检验呢?二者谁更精确?
【当堂检测】
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?
三、课后练习
【课后练习与提高】
1.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷体育迷合计
男
女1055
P(χ2≥k)0.050.01
k3.8416.635
(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中.采用随机抽样方法每次抽取1名观众,抽取3次.记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).
附:χ2=nn11n22-n12n212n1+n2+n+1n+2,
3.2.2独立性检验的基本思想及其初步应用
学习目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K2进行独立性检验.
学习重点:独立性检验的应用
学习过程
一.前置测评
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据? 。
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业
性别非统计专业统计专业
男1310
女720
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
K2 ,∵K2≥3.841,
所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 。
附:临界值表(部分):
(K2≥k0)
0.100.050.0250.010
k02.7063.8415.0246.635
二.典型例题
例1 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
喜欢数学课程不喜欢数学课程 总 计
男 37 85 122
女 35 143 178
总 计 72 228 300
由表中数据计算得到 的观察值k≈4.514. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?
例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?
有效无效合计
口服584098
注射643195
合计12271193
谈一谈:结合例1和例2你如何理解独立性检验。
三、巩固练习:
1.某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
不健康健 康总计
不优秀41626667
优 秀37296333
总 计789221000
2.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷体育迷合计
男
女1055
合计
P(χ2≥k)0.050.01
k3.8416.635
(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中.采用随机抽样方法每次抽取1名观众,抽取3次.记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).
附:χ2=nn11n22-n12n212n1+n2+n+1n+2,
3.通过随即询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男女总计
爱好402060
不爱 好203050
总计6050110
由 算得, .
附表:
0.0500.0100.001
3.8416.63510.828
参照附表,得到的正确结论是
A.在犯错的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B. 在犯错的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D. 有99%以上的把握认为“爱好该项运动与性别无关”