第一篇:样本估计总体及统计图习题精选
样本估计总体及统计图习题精选
一、选择题(共23小题)
1、(2010•梧州)为了估计水塘中的鱼数,养鱼者首先从鱼塘中捕获30条鱼,在每一条鱼身上做好几号后把这些鱼放归鱼塘.再从鱼塘中打捞200条鱼,如果在这200条鱼中有5条鱼是有记号的,则鱼塘中鱼的条数可估计为()
A、3000条B、2200条C、1200条D、600条
2、(2010•南通)某纺织厂从10万件同类产品中随机抽取了100件进行质检,发现其中有5件不合格,那么估计该厂这10万件产品中合格品约为()
A、9.5万件B、9万件 C、9500件D、5000件
3、(2008•张家界)我市属国家珍稀动物“大鲵”保护地,科考人员某日在其中一个保护区捕捞6只大鲵,并在它们身上都做了标记后放回,几天后,在该保护区又捕捞18只大鲵,其中2只身上有标记,据此估计该保护区约有大鲵多少只()
A、54B、24C、32D、1084、(2008•芜湖)为了解2008年6月1日“限塑令”实施情况,当天某环保小组对3600户购物家庭随机抽取600户进行调查,发现其中有156户使用了环保购物袋购物,据此可估计该3600户购物家庭当日使用环保购物袋约有()
A、936户B、388户C、1661户D、1111户
5、(2008•青岛)一个口袋中有3个黑球和若干个白球,在不允许将球倒出来数的前提下,小明为估计其中的白球数,采用了如下的方法:从口袋中随机摸出一球,记下颜色,然后把它放回口袋中,摇匀后再随机摸出一球,记下颜色,…,不断重复上述过程.小明共摸了100次,其中20次摸到黑球.根据上述数据,小明可估计口袋中的白球大约有()
A、18个B、15个 C、12个D、10个
6、(2008•济南)“迎奥运,我为先”联欢会上,班长准备了若干张相同的卡片,上面写的是联欢会上同学们要回答的问题.联欢会开始后,班长问小明:你能设计一个方案,估计联欢会共准备了多少张卡片小明用20张空白卡片(与写有问题的卡片相同),和全部写有问题的卡片洗匀,从中随机抽取10张,发现有2张空白卡片,马上正确估计出了写有问题卡片的数目,小明估计的数目是()
A、60张B、80张 C、90张D、1107、(2006•茂名)为了估计湖中有多少条鱼,先从湖中捕捞100条鱼都做上记号,然后放回湖中去,经过一段时间,待有标记的鱼完全混合于鱼群后,第二次再捕捞100条鱼,发现其中10条有标记,那么你估计湖中大约有()鱼.
A、500条B、600条 C、800条D、1000条
8、为估计某地区黄羊的只数,先捕捉20只黄羊给它们分别作上标志,然后放回,待有标志的黄羊完全混合于黄羊群后,第二次捕捉60只黄羊,发现其中2只有标志.由这些信息,我们可以估计该地区有黄羊()
A、400只B、600只 C、800只D、1000只
9、某烟花爆竹厂从20万件同类产品中随机抽取了100件进行质检,发现其中有5件不合格,那么你估计该厂这20万件产品中合格品约为()
A、1万件B、19万件 C、15万件D、20万件
10、光明中学的七年级学生对月球上是否有水的猜想,有35%的人认为有水,45%的人认为无水,20%的人不知道,该校现有七年级学生480人,则认为有水的学生有()
A、96人B、216人 C、168人D、200人
11、某养猪场有1000头猪,从中任意抽取15头猪,对它们的体重检测,知这15头猪2250kg,则估计这1000头猪共重()
A、150000kgB、300000kg C、15000kgD、30000kg12、为了解某市初中生视力情况,有关部门进行了一次抽样调查,数据如下表,若该市共有初中生15万人,则全市视力不良的初中生的人数大约是()
A、2160人B、7.2万人
C、7.8万人D、4500人
13、国际上通常用恩格尔系数(记作n)来衡量一个国家和地区人民的生活水平的状况,它的计算公式:n=x/y(x:家庭食品支出总额;y:家庭消费支出总额).各种家庭类型的n如下表:
已知王先生居住地2008年比2003年食品价格上升了25%,该家庭在2008年购买食品和2003年完全相同的情况下多支出2000元,并且y=2x+3600(单位:元),则该家庭2003年属于()
A、贫困B、温饱
C、小康D、富裕
14、宾馆有100间相同的客房,经过一段时间的经营,发现客房定价与客房的入住率之间有下表所示的关系,按照这个关系,要使客房的收入最高,每间客房的定价应为()
A、300元B、280元
C、260元D、220元
15、(2010•南昌)某学生某月有零花钱a元,其支出情况如图所示,那么下列说法不正确的是()
A、该学生捐赠款为0.6a元B、捐赠款所对应的圆心角为240°
C、捐赠款是购书款的2倍D、其他消费占10%
16、(2010•江汉区)某校开展“了解传统习俗,弘扬民族文化”为主题的实践活动.实践小组就“是
否知道端午节的来由”这个问题,对部分学生进行了调查,调查结果如图,其中不知道的学
生有8人.下列说法不正确的是()
A、被调查的学生共50人B、被调查的学生中“知道”的人数为32人 C、图中“记不清”对应的圆心角为60° D、全校“知道”的人数约占全校人数的64%
17、(2009•湛江)沃尔玛商场为了了解本商场的服务质量,随机调查了本商场的100名顾客,调查的结果如图所示,根据图中给出的信息,这100名顾客中
对该商场的服务质量表示不满意的有()
A、6人B、11人
C、39人D、44人
18、(2007•徐州)九年级某班在一次考试中
对某道单选题的答题情况如图所示:
根据以上统计图,下列判断中错误的是
()
A、选A的人有8人
B、选B的人有4人
C、选C的人有26人
D、该班共有50人参加考试
19、(2007•黄冈)如图,反映的是某中学七
(3)班学生外出乘车、步行、骑车的人数直方图(部分)
和扇形分布图,则下列说法不正确的是()
A、七(3)班外出步行的有8人
B、七(3)班外出的共有40人
C、在扇形统计图中,步行人数所占的圆心角度数为82°
D、若该校七年级外出的学生共有500人,那么估计全年级
外出骑车的约150人
20、(2008•旅顺口区)如图所示是某校九年级学生到校方式的条形统计图,根据图形可得出步行人数占总人数的()
A、60%B、50%
C、30%D、20%
21、(2002•嘉兴)图甲、乙所示分别是我国1997~2000年全国初中在校生人
数和全国初中学校统计图,由图可知,从1997年到2000年,我国初中在校
生人数()
A、逐年增加,学校数也逐年增加
B、逐年增加,学校数逐年减少
C、逐年减少,学校数也逐年减少
D、逐年减少,学校数逐年增加
22、如图,所提供的信息正确的是()
A、七年级学生最多
B、九年级的男生是女生的两倍
C、九年级学生女生比男生多D、八年级比九年级的学生多
23、(2005•泰安)某人才市场2004年上半年应聘和招聘人数排名前5个
类别的情况如下图所示,若用同一类别中应聘人数与招聘人数比值的大小
来衡量该类别的就业情况,则根据图中信息,下列对就业形势的判断一定
正确的是()
提示:请注意理解图片是应聘和招聘人数排名前5个类别的情况.
A、医学类好于营销类B、金融类好于计算机类 C、外语类最紧张D、建筑类好于法律类
第二篇:用样本的数字特征估计总体的数字特征反思
《用样本的数字特征估计总体的数字特征》教学反思
上课前我认真研读了教学大纲和课本,对统计这一部分知识有整体的认识,在此基础上作了近年的高考题,并了解了学生的学习情况,认真准备了本节课。总的来说今天课堂上,不但发展了学生的智力因素,提高了学生在课堂40分钟的学习效率,出色地完成教学任务。我从以下几方面总结:
1、自身教学方面
通过自身努力,不断用问题引导学生在知识、能力、技能、心理、思想品德等方面达到预定的目标,以提高学生的综合素质。上课时目标展示速度合适,学生对整节课的学习内容有了整体把握;探究新知识时语速有点快;在学生练习时计算速度稍慢;对学生的回答都作出了评价,并且以鼓励为主。
2、学生情况方面
学生回答问题时不够踊跃;我设计了一个探究环节及4个练习题,探究时感觉学生声音不大,讨论不太热烈。学生对知识掌握的还可以,通过小测和平时的做题可以看出学生掌握的还不错。对学生在课堂上的表现,要及时加以总结,适当给予鼓励,并处理好课堂的偶发事件,及时调整课堂教学。在教学过程中,教师要随时了解学的对所讲内容的掌握情况。如在讲完一个概念后,让学生复述;讲完一个例题后,将解答擦掉,请中等水平学生上台板演。有时,对于基础差的学生,可以对他们多提问,让他们有较多的锻炼机会,同时教师根据学生的表现,及时进行鼓励,培养他们的自信心,让他们能热爱数学,学习数学。
3、在内容方面上
总的说整堂课进行的比较顺利,也圆满完成了本堂课的三个教学目标,学生接受的也没问题;在知识上没有知识体系的遗漏,并且关键的地方都有师生讨论,去发现问题,去解决问题,掌握知识关键点在哪里。
4、我自身存在的不足
首先在教学方式:以后采用以学生为本,自主学习,自主探究,互帮互助,自己解决问题;真正意义上放手让学生自己学,教师少讲;此外,我们还可以结合课堂内容,灵活采用谈话、读书指导、作业、练习等多种教学方法。其次,为了让学生明确本堂课的重点、难点,教师在上课开始时,可以在黑板的一角将这些内容简短地写出来,以便引起学生的重视。教师要通过声音、手势、板书等的变化或应用模型、投影仪等直观教具,刺激学生的大脑,使学生能够兴奋起来,适当地还可以插入与此类知识有关的笑话,对所学内容在大脑中刻下强烈的印象,激发学生的学习兴趣,提高学生对新知识的接受能力。再次多创设情景,像今天的课堂这样多举身边的例子,多举与生活息息相关的例子,激发他们的积极性,激发他们的兴趣。
第三篇:第2课时 用样本平均数估计总体平均数(教案)
第2课时 用样本平均数估计总体平均数
【知识与技能】
1.掌握频数分布表(或频数分布直方图)中求这组数据的平均数的方法.2.理解并掌握用样本平均数对总体进行估计的思想方法.【过程与方法】
经历探究、思考、推理与计算的过程,进一步加深学生对加权平均数中的权的理解,体验统计中的思维方式与数学思维方式的不同,加深用样本对总体进行估计的思想认识.【情感态度】
进一步认识数学与人类生活的密切联系,增强数学应用意识和能力,激发学数学的热情.【教学重点】
频数分布中的平均数的计算及用样本平均数估计总体平均数的思想.【教学难点】
频数分布表(或直方图)中数据的确定及相应权的意义.一、情境导入,初步认识
问题 下表是某班学生右眼视力的检查结果:
你能求出该班学生右眼视力的平均水平吗?与同伴交流.二、思考探究,获取新知
在求n个数的算术平均数时,如果x1出现f1次,x2出现f2次,…,xk出现fk次(这里f1+f2+…fk=n),那么这n个数的算术平均数xx1f1x2f2xkfk叫x1,x2…xk这k个
f1f2fk数的加权平均数,其中f1,f2,…,fk分别叫做x1,x2…,xk的权.探究 为了解5路公共汽车的营运情况,公交部门统计了某天5路公共汽车每个运行班次的载客量,得到下表:
这天5路公共汽车平均每班的载客量是多少?
【教学说明】老师提问后,先让学生自主探究,相互交流,然后教师给予指导,说明在不知道原始数据情况下,可以利用组中值和频数近似地计算一组数据的平均数.如在1≤x<21情况下,有3个班次,那么这3个班次的平均数为
1
21=11,从而可以估计2这天5路公共汽车的载客量在1≤x<21情况下的总数为11×3=33人;类似地可得到这天5路公共汽车载客总量应约为11×3+31×5+51×20+71×22+91×18+111×15,因而平均每个班次的载客量约为
1133155120712291181111573人.3520221815试一试 为了绿化环境,柳荫街引进一批法国梧桐,三年后这些树的树干的周长情况如图所示,计算这批法国梧桐树干的平均周长(精确到0.1cm).【教学说明】学生自主探究.关注学生能否确定各组数据的组中值,能不能根据组中值来求这批梧桐树干的平均周长.三、典例精析,掌握新知
例
某灯泡厂为了测量一批灯泡的使用寿命,从中抽查了100只灯泡,它们的使用寿命如下表所示:
这批灯炮的平均使用寿命是多少?
【分析】我们知道,当所考察对象很多,或考察对象带有破坏性时,统计中常常用样本的特征对总体进行估计,来获得对总体的认识,因而要想了解这批灯泡的平均使用寿命,可通过抽取的100只灯泡的平均使用寿命来对总体进行估计.这里的组中值应分别为800,1200,1600,2000,2400,它们的权依次为10,19,25,34,12,利用加权平均数可得到样本的平均使用寿命,并可用它当作这批灯泡的平均使用寿命.【教学说明】教师与学生一道分析后,应让学生感受到用样本估计总体的思想.解答过程由学生自己完成.试一试 种菜能手李大叔种植了一批新品种黄瓜.为了考察这种黄瓜的生长情况,李大叔抽查了部分黄瓜株上长出的黄瓜根数,得到下面的条形图.请估计这个新品种黄瓜平均每株结多少根黄瓜.四、师生互动,课堂小结 1.本节中利用加权平均数求一组数据的平均数与上节有哪些不同?你是如何理解的?
2.通过样本的特征对总体进行估计的原因是什么?谈谈你的想法,并与同伴交流.1.布置作业:从教材“习题20.1”中选取.2.完成练习册中本课时练习.上一课时的教学主要是对加权平均数的概念和求法以及内涵进行了探讨.但在实际生活中,还需要注意根据统计图求加权平均数的情况.所以本课时第一个内容是如何对一般条形统计图和频数分布表、频数分布直方图进行数据分析,求出加权平均数.第二个内容主要探讨的是如何用样本平均数估计总体平均数.在上述整个教学过程中,教师要注意向学生讲解如何将“图表”转化为“数”,又为什么要用样本平均数估计总体平均数.这样学生在无形中更加深刻理解了“转化”的重要性.
第四篇:高三数学第一轮复习课时作业(55)用样本估计总体
课时作业(五十五)第55讲 用样本估计总体
时间:45分钟分值:100分
基础热身
1.2011·福建四地六校联考甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
A.甲B.乙C.丙D.丁
2.2011·福州质检图K55-1是歌手大奖赛中,七位评委为甲,乙两名选手打出的分数的茎叶图(其中m为数字0—9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()
A.a2
1C.a1=a2D.a1,a2的大小不确定
3.2011·皖北协作区模拟现有10个数,其平均数是4,且这10个数的平方和是200,那么这个数组的标准差是()
A.1B.2C.
3D.
4*能力提升
5.2012·豫南九校联考一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图K55-2如下,测得平均身高为177 cmx的值为()
A.5B.6C.7D.8
1222226.2011·琼海一模已知一组正数x1,x2,x3,x4的方差为s(x1+x2+x3+x4-16),则数据x1+2,x24
+2,x3+2,x4+2的平均数为()
A.2B.3C.4D.6
7.袋中共有8个球,其中3个红球、2个白球、3个黑球.若从袋中任取3个球,则所取3个球中至多有1个红球的概率是()
937A.B.1456
395C.567
8.2011·西安八校联考从生产线上每隔30分钟取一产品,共取了n件,测得其尺寸后,画得其频率分布直方图如图K55-3,若尺寸在15,45内的频数为46,则尺寸在20,25)内的产品个数为()
A.5B.10
C.15D.
9.如图K55-4所示是一样本的频率分布直方图.则由图中的数据,可以估计众数与中位数分别是()
A.12.5,12.5B.12.5,13 C.13,12.5D.13,1
310.2011·九江六校三联在某次法律知识竞赛中,将来自不同学校的学生的成绩绘制成如图K55-5所示的频率分布直方图.已知成绩在________人.
11.2012·大同调研将容量为n的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=________.12.2011·温州二模世界卫生组织(WHO)证实,英国葛兰素史克(GSK)药厂生产的甲型流感疫苗在加拿大种植后造成多人出现过敏症状的情况,下面是加拿大五个地区有过敏症状人数(单位:个)的茎叶统计图如图K55-6,则该组数据的标准差为________.13.2011·浙江卷 某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图K55-7).根据频率分布直方图推测,推测这3000名学生在该次数学考试中成绩小于60分的学生数是________.
图K55-7
14.(10分)从某项综合能力测试中抽取100人的成绩,统计如表,求这100人成绩的标准差.
15.(13分)某市教育行政部门为了对2010届高中毕业生学业水平进行评价,从该市高中毕业生抽取1000名学生学业水平考试数学成绩为样本进行统计,已知该样本中的每个值都是40,100中的整数,且频率分布直方图如图K55-8所示.记这1000名学生学业水平考试数学平均成绩的最小可能值为a,最大可能值为b.(1)求a,b的值;
(2)从这1000名学生中任取1人,试根据直方图估计其成绩位于a,b中的概率(假设各小组数据平均分布在相应区间内的所有整数上).
难点突破
16.(12分)2011·惠州调研某高校在2011年的自主招生考试成绩中随机抽取100名学生的笔试成绩,(1)
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?
(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A考官进行面试,求第4组至少有一名学生被考官A面试的概率?
课时作业(五十五)
【基础热身】
1.C 解析 由表格可知,丙的平均成绩最高,且丙的方差最小,所以最佳人选是丙,故选C.2.B 解析 由茎叶图,甲、乙选手去掉一个最高分和一个最低分后,为中间的5个数据,则
5+4+5+5+14+4+6+4+7
a1=80+=84,a2=80=85,故选B.5
53.B 解析 由标准差公式,得
s=
1222
2x1+x2+…+x10-10x)= 10
(200-10×4)=2,故选B.10
4.0.7 解析 由样本容量为20,得x+y=9,则【能力提升】
5+x+y1
4=0.7.2020
5.D 解析 由茎叶图,得x=(180×2+1+170×5+x+20)=177,解得x=8,故选D.7122222
6.C 解析 由方差公式,s=(x1+x2+…+xn-nx),得x=2,则所求平均数为
n
x1+2)+(x2+2)+(x3+2)+(x4+2)=x+2=4,故选C.4
7.D 解析 至多有一个红球的事件是没有红球和只有一个红球这两个互斥事件的和,根据互斥事件的概率
312
C5C3C5405
加法公式得所求的概率是+.C8C8567
8.B 解析 由直方图,得数据在10,15)的频率为0.016×5=0.08,则数据在15,45内的频率为1-0.08
=0.92,则0.92,解得n=50,n
则尺寸在20,25)内的产品个数为0.04×5×50=10,故选B.0.5-0.2
9.B 解析 众数是区间10,15)的中点,中位数是10+=13.0.110.25 解析 设总人数为x,则有0.04×10x=40,得x=100,故成绩在70,80)的人数为0.015×10×100=15,成绩在80,90)的人数为0.01×10×100=10,所以成绩在70,90)的有25人.
2+3+49
11.60 解析 由已知,得·n=27,即n=27,解得n=60.2+3+4+6+4+12012.2 解析 由茎叶图,得该组数据的平均数为x=90,则该组数据的标准差为
s=
22222
-90)+(87-90)+(90-90)+(91-90)+(93-90)5=2.13.600 解析 设满足所求条件的学生人数为x名,由频率分布直方图可知200名学生中60分以下学生为
x40
200×(0.002+0.006+0.012)×10=40(名).又=x=600.3000200
100+40+90+60+10
14.解答 ∵x==3,100
12222
∴s=(x1-x)+(x2-x)+…+(xn-x)
n
==
12222
20×2+10×1+30×1+10×2 100
1608210
=⇒s=10055
15.解答(1)a=0.05×40+0.1×50+0.25×60+0.35×70+0.15×80+0.1×90=67.5,b=0.05×50+0.1×60+0.25×70+0.35×80+0.15×90+0.1×100=77.5.28
(2)由于成绩是整数,故成绩为68,69的频率是×0.25,成绩为70,71,…,76,77×0.35,1010
故成绩在a,b上的频率是×0.250.35=0.33,以样本的这个频率估计总体分布的概率得出,从这1000
1010
名学生中任取1人,根据直方图估计其成绩位于a,b中的概率为0.33.【难点突破】
16.解答(1)由题可知,第2组的频数为0.35×100=35人,30
第3组的频率为=0.300,100
频率分布直方图如下:
(2)因为第3、4、5组共有606名学生,每组分别为:第3302010
组:6=3(人),第4组:×6=2(人),第5组:6=1(人),606060所以第3、4、5组分别抽取3人、2人、1人.
(3)设第3组的3位同学为A1,A2,A3,第4组的2位同学为B1、B2,第5组的1位同学为C1,则从6位同学中抽两位同学有15种可能如下:
(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),(A3,C1),(B1,B2),(B1,C1),(B2,C1),第4组至少有一位同学入选的有:
(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),(B1,C1),(B2,C1),9种可能.
所以其中第4组的2位同学至少有一位同学入选的概率为.155
第五篇:高中数学第一章统计1.5.2估计总体的数字特征教案
5.2 估计总体的数字特征
整体设计
教学分析
教科书通过现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.三维目标
1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识与现实世界的联系.重点难点
教学重点:根据实际问题从样本数据中提取基本的数字特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排 1课时
教学过程
导入新课
思路1.平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生中抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2.在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下: 甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.我们知道x甲=7,x乙=7,两个人射击的平均成绩是一样的,那么,是否两个人就没有水平差距呢?
图1 从图1直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此这 节课我们从另外的角度来考察这两组数据,引入课题:标准差.推进新课 新知探究 提出问题
(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?
2(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm),通过计算发现,两个样本的平均数均为125.甲 110 120 130 125 120 125 135 125 135 125 乙 115 100 125 130 115 125 125 145 125 145 哪种钢筋的质量较好?
(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773);乙:800, 860, 850, 750, 750, 800, 700(平均787).请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的离散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度? 讨论结果:
(1)利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字(最高矩形的中点).估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)
图2 由图2可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的离散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的离散程度小, 如何用数字去刻画这种离散程度呢? 考察样本数据的离散程度的大小,最常用的统计量是方差和标准差.标准差:
考察样本数据的离散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1,x2,„,xn,x表示这组数据的平均数.xi到x的距离是 |xix|(i=1,2,„,n).于是,样本数据x1,x2,„,xn到x的“平均距离”是 s=|x1x||x2x||xnx|.n由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=1[(x1x)2(x2x)2(xnx)2].n意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定;标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如, 在关于居民月均用水量的例子中,平均数x=1.973,标准差s=0.868,所以 x+s=2.841,x+2s=3.709; x-s=1.105,x-2s=0.237.这100个数据中,在区间[x-2s,x+2s]=[0.237,3.709]外的只有4个,也就是说,[x-2s,x+2s]几乎包含了所有样本数据.2从数学的角度考虑,人们有时用标准差的平方s——方差来代替标准差,作为测量样本数据离散程度的工具,其中s=
21222
[(x1-x)+(x2-x)+„+(xn-x)].n显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.应用示例
思路1 例1 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即 可算出每一组数据的标准差.解:四组样本数据的条形图如图3:
图3 四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的离散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48 从生产的零件内径的尺寸看,谁生产的质量较高? 分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得x甲≈25.401,x乙≈25.406;s甲≈0.037,s乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s甲
某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:
100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格).解:运用计算器计算得:
100129030801870246012504=79.40,100(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2
2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 解:甲品种的样本平均数为10,样本方差为
22222[(9.8-10)+(9.9-10)+(10.1-10)+(10-10)+(10.2-10)]÷5=0.02.乙品种的样本平均数也为10,样本方差为
22222[(9.4-10)+(10.3-10)+(10.8-10)+(9.7-10)+(9.8-10)]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.151—18181—21211—24241—27271—30301—33331—36361—39天数
0 0 0 0 0 0 0 0 灯泡数 1 11 18 20 25 16 7 2 分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195×11%
+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).这些组
中
值
2的方
2差为
11002
×[1×(165-268)+11×(195-268)+18×(225-268)+20×(255-268)+25 22222×(285-268)+16×(315-268)+7×(345-268)+2×(375-268)]=2 128.60(天).故所求的标准差约为2128.60≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.知能训练(1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为___________.2(2)若给定一组数据x1,x2,„,xn,方差为s,则ax1,ax2,„,axn的方差为___________.(3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲 27 38 30 37 35 31 乙 33 29 38 34 28 36 试判断选谁参加某项重大比赛更合适?
22答案:(1)9.5,0.016(2)as(3)x甲=33,x乙=33,s甲=
247237>s乙=,乙的成绩比甲稳定,应选乙参加比赛更合适.33拓展提升
某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则a条鱼中带有标记的条数鱼塘中所有带有标记的鱼的条数(x).a鱼塘中鱼的总条数 这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入.课堂小结
1.用样本的数字特征估计总体的数字特征分两类:
用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确.作业
习题1—5 3.设计感想
统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.