第九章 统计与统计案例 章节检测(基础卷)
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1.(2021·黑龙江双鸭山市·双鸭山一中高二开学考试)我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等六项专项附加扣除,某单位老年、中年、青年员工分别有80人、100人、120人,现采用分层随机抽样的方法,从该单位上述员工中抽取30人调查专项附加扣除的享受情况,则应该从青年员工中抽取的人 数为()
A.8人 B.10人 C.12人 D.18人
【答案】C
【详解】由题意可得抽取30人中青年员工有,故选:C
2.(2021·内蒙古乌兰察布市·集宁二中高一期末)采用系统抽样方法,从个体数为1001的总体中抽取一个容量为40的样本,则在抽取过程中,被剔除的个体数与抽样间隔分别为()
A.1,25 B.1,20 C.3,20 D.3,25
【答案】A
【详解】解:因为
余1,所以在抽取过程中被剔除的个体数是1;抽样间隔是25.故选:A.
3.(2021·曲靖市沾益区第四中学高二月考(理))总体由编号为00,01,…,28,29的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列开始由左到右依次选取两个数字.则选出来的第5个个体的编号为()
0842 2689 5319 6450 9303 2320 9025 6015
9901 9025 2909 0937 6707 1528 3113 1165
0280 7999 7080 1573 6147 6403 2366 5398
A.19 B.02 C.11 D.16
【答案】C【详解】
按随机数表法,从第1行的第6列和第7列开始从左往右依次选取两个数字,得到的在00~29范围之内的两位数依次是09,09,02,01,19,02,11,其中09和02各重复了一次,去掉重复的数字后,前5个编号是09,02,01,19,11.故选:C
4.(2021·广东汕头市·高二期末)根据下表样本数据
用最小二乘法求得线性回归方程为,则的值为()
A.10.2 B.10.3 C.10.4 D.10.5
【答案】B【详解】因为,所以有,故选:B
5.(2021·山西吕梁市·高二期中(文))2022卡塔尔世界杯揭幕战将在2022年11月21日打响,决赛定于12月18日晚进行,全程为期28天.随机询问100人是否喜欢足球,得到如下的列联表:
喜欢足球 | 不喜欢足球 | 总计 | |
男 | |||
女 | |||
总计 |
参考公式:
(其中)
临界值表:
0.05 | 0.025 | 0.010 | |
3.841 | 5.024 | 6.635 |
参照临界值表,下列结论正确的是()
A.有的把握认为“喜欢足球与性别无关”
B.有的把握认为“喜欢足球与性别相关”
C.在犯错误的概率不超过的前提下,认为”喜欢足球与性别无关”
D.在犯错误的概率不超过的前提下,认为“喜欢足球与性别有关”
【答案】B
【详解】由题意:,由于,所以有的把握认为“喜欢足球与性别有关”.故选:B
6.(2021·黑龙江齐齐哈尔市教育局高二期末(文))为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:
根据图中的信息,下列结论中不正确的是()
A.样本中多数男生喜欢手机支付
B.样本中的女生数量少于男生数量
C.样本中多数女生喜欢现金支付
D.样本中喜欢现金支付的数量少于喜欢手机支付的数量
【答案】C【详解】对于A,由右图可知,样本中多数男生喜欢手机支付,A对;
对于B,由左图可知,样本中的男生数量多于女生数量,B对;
对于C,由右图可知,样本中多数女生喜欢手机支付,C错;
对于D,由右图可知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,D对.故选:C.
根据散点图选择
和
两个模型进行拟合,经过数据处理得到的两个回归方程分别为
和,并得到以下一些统计量的值:
0.923 | 0.973 |
注:
是样本数据中的平均数,是样本数据中的平均数,则于列说法不一定成立的是()
A.当月在售二手房均价
与月份代码
呈正相关关系
B.根据
可以预测2021年2月在售二手房均价约为1.0509万元/平方米
C.曲线
与的图形经过点
D.
回归曲线的拟合效果好于
【答案】C
【详解】对于A,散点从左下到右上分布,所以当月在售二手房均价
与月份代码
呈正相关关系,故A正确;对于B,令,由,所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B正确;对于C,非线性回归方程不一定经过,故
错误;
对于D,越大,拟合效果越好,故D正确.故选:C.8.(2021·湖北华中师大一附中)某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价
(元)和销售量
(件)之间的一组数据如表所示:
价格 | 9.5 | 10.5 | |||
销售量 |
按公式计算,与的回归直线方程是:,相关系数,则下列说法错误的是()
A.变量,线性负相关且相关性较强; B.;
C.当
时,的估计值为12.8; D.相应于点的残差为0.4.
【答案】D
【详解】
对A,由表可知
随
增大而减少,可认为变量,线性负相关,且由相关系数
可知相关性强,故A正确.对B,价格平均,销售量
.故回归直线恒过定点,故,故B正确.对C,当
时,故C正确.对D,相应于点的残差,故D不正确.故选:D
二、多选题(本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.)
9.(2021·山东济宁·)下列说法正确的是()
A.若变量
与的线性回归方程为,则
与
负相关.B.样本相关系数的绝对值越大,成对数据的线性相关程度越强.C.用决定系数
来刻画回归模拟效果时,若
越小,则模型的拟合效果越好.D.用决定系数
来刻画回归模拟效果时,若
越大,则残差平方和越小.【答案】BD
【详解】对于选项A:因为,所以
与
正相关.故A错误;
对于选项B:样本相关系数的绝对值越大,成对数据的线性相关程度越强.故B正确;
对于选项C和D:用决定系数
来刻画回归模拟效果时,若
越大,则残差平方和越小,模型的拟合效果越好.故C错误,D正确.故选:BD.
10.(2021·广东高二期末)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从
年到
年共
年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额
看成以年份序号
(年作为第年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如图,则下列说法正确的是()
A.销售额
与年份序号
呈正相关关系
B.三次函数回归模型的残差平方和大于直线回归模型的残差平方和
C.三次函数回归曲线的拟合效果好于回归直线的拟合效果
D.根据三次函数回归曲线可以预测
年“年货节”期间的销售额约为
亿元
【答案】AC
【详解】解:由散点图的变化趋势可知,销售额
与年份序号
呈正相关关系,故选项A正确;
由散点图以及直线回归模型和三次函数回归模型的位置关系可知,三次函数回归模型的残差平方和小于直线回归模型的残差平方和,故选项B错误;
因为,所以三次函数回归曲线的拟合效果好于回归直线的拟合效果,故选项C正确;
因为三次函数为,则当
时,亿元,故选项D错误.
故选:AC.
11.(2021·广东韶关·高二期末)某学校为研究高三800名学生的考试成绩,在高三的第一次模拟考试中随机抽取100名高三学生的化学成绩绘制成频率分布直方图(如图所示),把频率看作概率,同一组中的数据用该组区间的中点值为代表,根据频率分布直方图,下列结论正确的是()
A.估计该校本次测试化学分数在区间的人数为360
B.估计该校本次测试化学平均分为71
C.估计该校本次测试化学成绩的中位数是
D.从高三学生中随机抽取4人,其中3人成绩在内的概率为
【答案】BC
【详解】
解:对于A,本次测试化学分数在区间的频率为:,∴估计该校本次测试化学分数在区间的人数为
人,故A错误;
对于B,估计该校本次测试化学平均分为:,故B正确;对于C,的频率为:,的频率为:0.3,∴估计该校本次测试化学成绩的中位数是:,故C正确;
对于D,成绩在内的频率为,从高三学生中随机抽取4人,其中3人成绩在内的概率为:,故D错误.BC.
12.(2020·重庆南开中学)某综艺节目为比较甲、乙两名选手的各项能力(指标值满分为5分,分值高者为优),分别绘制了如图所示的六维能力雷达图,图中点
表示甲的创造力指标值为4,点
表示乙的空间能力指标值为3,则下列叙述正确的是()
A.甲的六大能力中推理能力最差 B.甲的空间能力优于计算能力
C.乙的创造能力优于甲的创造能力 D.乙的六大能力整体水平低于甲
【答案】ABD
【详解】由六维能力雷达图,可得:对于A中,甲的推理能力为2比其他选手都低,所以A正确;
对于B中,甲的空间想象能力是5,计算能力是4,故甲的空间能力优于计算能力,所以B正确;
对于C中,乙的创造能力为3,甲的创造能力为4,所以乙的创造能力低于甲的创造能力,所以C不正确;
对于D中,乙的六大能力整体水平为,甲的六大能力整体水平为,可得,即乙的六大能力整体水平低于甲,所以D正确.故选:ABD.三、填空题:(本题共4小题,每小题5分,共20分,其中第16题第一空2分,第二空3分。)
13.(2021·江苏南京市第二十九中学高二期中)高二某班数学学习小组成员最近研究的椭圆的问题数x与抛物线的问题数y之间有如下的对应数据:
若用最小二乘法求得线性回归方程是,则表中的是_______________.【答案】4【详解】解:,回归直线经过样本中心,可得,解得
.故为:4
14.(2021·江苏常州·)已知样本数据,,的方差为2,则样本数据,,的方差为______.
【答案】18【详解】样本数据,,的方差为,所以样本数据,,的方差为:
.故答案为:18
15.(2021·重庆字水中学高二期末)某工厂为研究某种产品的产量
(吨)与所需某种原材料的质量
(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)
2.5 |
根据表中数据,得出
关于的经验回归方程为
.据此计算出在样本
处的残差为,则表中的值为______.
【答案】
【详解】因为样本
处的残差为,即,所以,所以回归方程为:,因为,因为样本中心点
在回归直线上,所以,解得:,故答案为:
.15.(2021·全国)“水能载舟,亦能覆舟”是古代思想家荀子的一句名言,意指事物用之得当则有利,反之必有弊害.对于高中生上学是否应该带手机,有调查者进行了如下的随机调查:调查者向被调查者提出两个问题:(1)你的编号是奇数吗?(2)你上学时是否带手机?学生在被调查时,先背对着调查人员抛掷一枚硬币(保证调查人员看不到硬币的抛掷结果),如果正面向上,就回答第一个问题,否则就回答第二个问题.被调查的学生不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,由于只有被调查者本人知道回答了哪一个问题,所以都如实地做了回答.某次调查活动共有800名高中生(编号从1至800)参与了调查,则回答为“不是”的人数的最大值是______.如果其中共有260人回答为“是”,则由此可以估计这800名学生中,上学带手机的人数约为______.【答案】800 120
【详解】解:∵某次调查活动共有800名高中生参与了调查,∴回答为“不是”的人数的最大值是800,∵掷一枚硬币正面向上和反面向上的概率均为0.5,∴回答第一个问题和第二个问题的人数大约为400,而学号为奇数和偶数的概率均为0.5,则回答第一个问题的人中回答“是”的占200人,∵其中共有260人回答为“是”,∴在回答问题(2)的400人中,回答“是”人数为260-200=60,∴这800名学生中,上学带手机的人数约为120,故答案为:800;120.
四、解答题(本题共6小题,共70分,其中第16题10分,其它每题12分,解答应写出文字说明、证明过程或演算步骤。)
17.(2020·合肥百花中学高一期末)某学校因为寒假延期开学,根据教育部停课不停学的指示,该学校组织学生线上教学,高一年级在线上教学一个月后,为了了解线上教学的效果,在线上组织了数学学科考试,随机抽取50名学生的成绩并制成频率分布直方图如图所示.
(1)求的值,并估计高一年级所有学生数学成绩在频率
分的学生所占的百分比;
(2)估计这50名学生数学成绩的平均数.(同一组中的数据以该组区间的中点值作代表)
【答案】(1),(2)
【详解】(1)由频率分布直方图可知,50名学生数学成绩在分的概率为,所以高一年级所有学生数学成绩在频率
分的学生所占的百分比为,(2)这50名学生数学成绩的平均数为
18.(2021·海原县第一中学高一期末)某产品的广告费支出
与销售额
(单位:百万元)之间有如下对应数据:
(1)求线性回归方程;
(2)预测当广告费支出
(百万元)时的销售额.
(回归直线方程是:,其中,【答案】(1)
;(2)
百万元.【详解】
(1)由题意,,而,∴,则,∴线性回归方程为
.(2)当
时,(百万元).19.(2021·陕西高一期末)某个体服装店经营某种服装,在某周内每天获纯利
(元)与该周每天销售这种服装件数
之间的一组数据关系如下表所示.
已知,.
(1)求,;(2)画出散点图;
(3)求纯利
与每天销售件数
之间的回归直线方程(结果保留两位小数);
(4)若该周内某天销售服装20件,估计可获纯利多少元.(精确到1元)
注:,.
【答案】(1),;(2)作图见解析;(3)
;(4)146元.
【详解】
(1),;
(2)散点图如图所示.
(3)由散点图知
与
具有线性相关关系,设回归直线方程为
.
∵,,,∴,∴回归直线方程为;
(4)当
时,.
∴该周内某天的销售量为20件时,估计这天可获纯利146元.
20.(2021·黑龙江哈尔滨三中高三其他模拟(文))2021年春节,由贾玲导演的春节档电影《你好,李焕英》总票房已突破50亿元,影片的感人情节引起同学们广泛热议.开学后,哈三中团委在高二年级中(其中男生200名,女生150名),对是否观看该影片进行了问卷调查,各班男生观看人数统计记为
组,各班女生观看人数统计记为
组,得到如图的茎叶图.(1)根据茎叶图补全
列联表;
观看 | 没观看 | 合计 | |
男生 | 200 | ||
女生 | 150 | ||
合计 | 350 |
(2)判断是否有的把握认为观看该影片与性别有关?
0.05 | 0.025 | 0.005 | 0.001 | |
3.841 | 5.024 | 7.879 | 10.828 |
,.【答案】(1)列联表答案见解析;(2)没有的把握认为观看该影片与性别有关.【详解】
(1)依题意得
观看 | 没观看 | 合计 | |
男生 | 140 | 200 | |
女生 | 120 | 150 | |
合计 | 260 | 350 |
(2),所以没有的把握认为观看该影片与性别有关.21.(2020·江苏省高邮中学高三月考)在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数
(单位:万元)与时间
(单位:年)的数据,列表如下:
2.4 | 2.7 | 4.1 | 6.4 | 7.9 |
(1)依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数
并加以说明(计算结果精确到0.01).(若,则线性相关程度很髙,可用线性回归模型拟合)
附:相关系数公式:
参考数据:,(2)谈专营店为吸引顾客,特推出两种促销方案.
方案一:每满500元可减50元;
方案二:每满500元可抽奖一次,每次中奖的概率都为,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.
某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择返回现金,还是选择参加四次抽奖?说明理由.
【答案】(1)答案见解析;(2)专营店老板希望该顾客选择参加四次抽奖;理由见解析.
【详解】
解:(1)由题知,,.
则
.
故
与的线性相关程度很高,可以用线性回归方程拟合;
(2)设
表示顾客在四次抽奖中中奖的次数,由于顾客每次抽奖的结果相互独立,则,∴
.
由于顾客每中一次可获得100元现金奖励,因此顾客在四次抽奖中可获得的奖励金额的均值为
.
由于顾客参加四次抽奖获得现金奖励的均值160小于直接返现的200元现金,故专营店老板希望该顾客选择参加四次抽奖.
22.(2021·山西省长治市第二中学校高二期中(文))某企业为了提升行业核心竞争力,逐渐加大了科技投入.该企业连续
年来的科技投入
(百万元)与收益
(百万元)的数据统计如下:
科技投入 | ||||||
收益 |
根据散点图的特点,甲认为样本点分布在指数曲线的周围,据此他对数据进行了一些初步处理,如下表:
其中,.(1)(i)请根据表中数据,建立
关于的回归方程(保留一位小数);
(ii)根据所建立的回归方程,若该企业想在下一年的收益达到
亿,则科技投入的费用至少要多少?(其中)
(2)乙认为样本点分布在二次曲线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两位员工所建立的模型,谁的拟合效果更好.附:对于一组数据、、、,其回归直线方程的斜率和截距的最小二乘估计为,.相关指数
.【答案】(1)(i)
;(ii)至少要
百万元;(2)甲建立的回归模型拟合效果更好.【详解】
(1)(i),令,令,则,根据最小二乘法公式可知:,从而,故回归方程为,也即;
(ii)设,解得,所以科技投入的费用至少要
百万元.(2)因为,从而
即甲建立的回归模型拟合效果更好.