12+ 4 分项练 9 统计与统计案例
1. (2018 ·乡模拟新 )某中学有高中生 3 000 人,初中生 2 000 人,男、女生所占的比例如下图 所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为
n 的样本,
已知从高中生中抽取女生 21 人,则从初中生中抽取的男生人数是 ( )
A.12 答案 解析
B.15 A
C.20 D.21
因为分层抽样的抽取比例为
= 1 , 21
3 000× 0.7 100 2 000× 0.6
= 12.
100
所以从初中生中抽取的男生人数是
2.(2018 ·赣州模拟 )某工厂利用随机数表对生产的 进行编号: 001,002, , 699,700.从中抽取 行,若从表中第 32 21 18 34 29 12 23 43 56 77 84 42 12 53 31 23 45 78 07 32 56 78 08 43 22 53 55 78 32
700 个零件进行抽样测试, 先将 700 个零件
4行到第 6
70 个样本,如图提供了随机数表的第
6 个样本编号是 (
5 行第 6 列开始向右读取数据,则得到的第 78 54 07 32 35 78 90 56 42 34 57 86 07 36 23 68 96 08 04 67 53 55 77 45 77 23 45
)
52 42 06 44 38
25 30 07 32 86
34 94 83 75
A . 623 B. 328 C. 253 D. 007 答案
A
解析 从第 5 行第 6 列开始向右读取数据,
第一个数为 253,第二个数是 313,第三个数是 457, 下一个数是 860,不符合要求,下一个数是
736,不符合要求,下一个数是
253,重复,
第四个数是 007,第五个数是 328,第六个数是 623.
3.(2018 ·宁德质检 )下图是具有相关关系的两个变量的一组数据的散点图和回归直线, 一个点使得余下的 5 个点所对应的数据的相关系数最大,则应当去掉的点是
(
)
若去掉
A.D B.E C.F D.A 答案 解析
B
因为相关系数的绝对值越大,越接近 1,则说明两个变量的相关性越强.因为点
E 到
直线的距离最远,所以去掉点 E,余下的 5 个点所对应的数据的相关系数最大.
4.(2018 河·北省衡水中学模拟 )若 x1,x2, ,x2 018 的平均数为 3,方差为 4,且 yi=- 2 (xi- 2),
i= 1,2, , 2 018,则新数据 A.- 4,- 4 C.2,8 答案 解析
D
y1, y2, , y2 018 的平均数和标准差分别为 ()
B.- 4,16 D.- 2,4
∵ x1, x2, , x2 018 的平均数为 3,方差为 4,
∴ 1 (x1+ x2+ + x2 018)= 3,
2 018
2
1
2 2
2 018[(x1- 3) + (x2-3) + + (x2 018- 3)
1
]=4.
又 yi=- 2(xi- 2)=- 2xi+ 4, i= 1,2, , 2 018,
∴ y = 2 018[ - 2(x1+ x2+ + x2 018)+ 4×2 018]
1
=- 2 2 018 x1+ x2+ + x2 018 + 4=- 2,
2
1
2
2
2
s = 2 018[(- 2x1+ 4+2) + (- 2x2+4+ 2) + + (- 2x2 018+ 4+ 2) ]
1 2 2 2
= 2 018[4( x1- 3) + 4(x2- 3) + + 4(x2 018- 3) ]
1 2 2 2
= 4×2 018[(x1- 3) + (x2- 3) + +(x2 018- 3) ] = 16,
∴ 新数据 y1, y2, , y2 018 的平均数和标准差分别为- 2,4.
5.某班一次测试成绩的茎叶图和频率分布直方图可见部分如图, 根据图中的信息可确定被抽
测的人数及分数在 [90,100] 内的人数分别为 (
)
A . 20,2 B . 24,4 C.25,2
D . 25,4
答案
C
由频率分布直方图可知,
组距为 10,[50,60) 的频率为 0.008× 10= 0.08,由茎叶图可知
2
N,则 N= 0.08 =25,根据频率分布直方图可
2.
解析
[50,60) 的人数为 2,设参加本次考试的总人数为 知 [90,100] 内的人数与 [50,60) 内的人数一样,都是 6.(2018 湛·江模拟 )从某中学甲、乙两班各随机抽取
10 名同学,测量他们的身高 (单位: cm),
所得数据用茎叶图表示如下,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是
( )
A .甲班同学身高的方差较大 B .甲班同学身高的平均值较大 C.甲班同学身高的中位数较大
D.甲班同学身高在
175 cm 以上的人数较多
答案
A
观察茎叶图可知甲班同学数据波动大,则甲班同学身高的方差较大,
A 选项正确;
解析
甲班同学身高的平均值为
181+ 182+ 170+ 172+ 178+ 163+ 165+ 166+ 157+158
10
= 169.2,
乙班同学身高的平均值为
182+ 171+ 172+ 176+ 178+ 179+ 162+ 1+ 167+159
= 171,
10
则乙班同学身高的平均值大,
B 选项错误;
166+ 170
甲班同学身高的中位数为
2
= 168,
171+ 172
乙班同学身高的中位数为
2
= 171.5,
则乙班同学身高的中位数大, C 选项错误;
甲班同学身高在 175 cm 以上的人数为 3, 乙班同学身高在 175 cm 以上的人数为 4, 则乙班同学身高在
175 cm 以上的人数多, D 选项错误.
)
7.下列说法错误的是 ( A .回归直线过样本点的中心
( x , y )
B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于
^
1
^
C.在线性回归方程 y= 0.2x+ 0.8 中,当解释变量
y平均增x 每增加 1 个单位时,预报变量 加
0.2 个单位
D.对分类变量 X 与 Y,随机变量 K2 的观测值 k 越大,则判断“ X 与 Y 有关系”的把握程度越小
答案 解析
D
根据相关定义分析知
2
A , B,C 正确. D 中对分类变量 X 与 Y 的随机变量 K 的观测值
k 来说, k 越大, “ X 与 Y 有关系 ” 的把握程度越大,故 8.某学校为了制定节能减排的目标,调查了日用电量 位:℃ ),从中随机选取了
D 不正确.
y(单位:千瓦时 )与当天平均气温 x(单
4 天的日用电量与当天平均气温,并制作了对照表:
x y
^
17 24
15 34
10 a
- 2
由表中数据得到的线性回归方程为 A.34 B.36 C.38 D.42 答案
y=- 2x+ 60,则 a 的值为 (
)
C x =
解析
17+ 15+ 10- 2
4
24+ 34+ a+
= 10, y = ,
4
^
∵ y=- 2x+ 60 必过点 x , y ,
24+34+a+∴ =- 2×10+ 60,解得 a=
38. 4
9.某科研机构为了研究中年人秃头是否与患有心脏病有关,随机调查了一些中年人的情况,
()
具体数据如下表所示:
有心脏病
秃发 不秃发 总计
20 5 25
无心脏病
300 450 750
总计 320 455 775
775× (20×450- 5×300 )2 2
根据表中数据得 K = 25× 750× 320× 455 ≈ 15.968,由 K ≥ 10.828,断定秃发与患有心
2
脏病有关,那么这种判断出错的可能性为
P(K 2≥k0)
( 0.05
)
0.025 5.024
0.15 2.072
0.10 2.706
0.010 6.635
0.005 7.879
0.001 10.828
k0 3.841
A.0.1 B. 0.05 C. 0.01 D. 0.001 答案
D
由题意可知, K 2≥10.828,根据附表可得判断秃发与患有心脏病有关出错的可能性为
2014 年四个季度与
解析
0.001.
10. (2018 辽·宁省重点高中期末 )如图描述的是我国
2015 年前三个季度三
大产业 GDP 累计同比贡献率,以下结论正确的是
( )
A . 2015 年前三个季度中国 GDP 累计比较 2014 年同期增速有上升的趋势
B .相对于 2014 年, 2015 年前三个季度第三产业对 GDP 的贡献率明显增加
C.相对于 2014 年, 2015 年前三个季度第二产业对
GDP 的贡献率明显增加 GDP 的贡献率明显增加
D.相对于 2014 年, 2015 年前三个季度第一产业对
答案
B
解析 通过图形可以看出,最后三个条形中,白色条形所占的比重明显比前四个条形所占比
重要大,即相对于
2014 年, 2015 年前三个季度第三产业对 GDP 的贡献率明显增加,故选
B.
11.对某两名高三学生在连续
9 次数学测试中的成绩 (单位:分 )进行统计得到如下折线图.
(
)
下
面关于这两位同学的数学成绩的分析中,正确的个数为
①甲同学的成绩折线图具有较好的对称性,故而平均成绩为 130 分;
②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间 ③乙同学的数学成绩与考试次号具有比较明显的线性相关性,且为正相关; ④乙同学在这连续九次测验中的最高分与最低分的差超过 A.1 B. 2 C.3 D.4 答案 解析
C
[110,120] 内;
40 分.
① 甲同学的成绩折线图具有较好的对称性,最高 130 分,平均成绩为低于 130 分, ①
[110,120]
③
错误; ② 根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间
内, ②正确; ③乙同学的数学成绩与考试次号具有比较明显的线性相关性,且为正相关, 正确;④ 乙同学在这连续九次测验中的最高分大于 分的差超过 40 分,故 ④正确.故选 C.
130 分且最低分低于
90 分,最高分与最低
12. (2016 ·京北 )某学校运动会的立定跳远和 30 秒跳绳两个单项比赛分成预赛和决赛两个阶
段.下表为 学生序号 立定跳远 (单位:米 ) 30 秒跳绳 (单位:次 )
63
10 名学生的预赛成绩,其中有三个数据模糊.
1 1.9 6
1.92
2 3 1.82
4 1.80
5 1.78
6 1.76
7 1.74
8 1.72
9 1.68
10
1.60
a
75
60
63
72
70
a- 1
b
65
在这 10 名学生中,进入立定跳远决赛的有 有6人,则(
)
8 人,同时进入立定跳远决赛和
30 秒跳绳决赛的
A . 2 号学生进入 30 秒跳绳决赛 B .5 号学生进入 C.8 号学生进入 D. 9 号学生进入
30 秒跳绳决赛 30 秒跳绳决赛 30 秒跳绳决赛
答案 解析
B
由数据可知, 进入立定跳远决赛的 8 人为 1~8 号,所以进入 30 秒跳绳决赛的 6 人需 3 人需从 63, a,60,63,
要从 1~ 8 号产生,数据排序后可知第 a- 1 五个得分中抽取,若 以 63 分必进决赛.故选
B.
3,6,7 号必须进跳绳决赛,另外
63 分的人未进决赛,则 60 分的人就会进入决赛,与事实矛盾,所
13. (2018 大·连模拟 )某班共有 36 人,编号分别为 1,2,3, , 36.现用系统抽样的方法,抽取 一个容量为 4 的样本,已知编号 答案 解析
3,12,30 在样本中,那么样本中还有一个编号是________.
21
由于系统抽样得到的编号组成等差数列, 36
因为
4 = 9,所以公差为
9,
因为编号为 3,12,30,所以第三个编号为 12+ 9= 21.
14.某学校为了了解住校学生每天在校平均开销情况,随机抽取了
500 名学生,他们每天在
校平均开销都不低于 20 元且不超过 60 元,其频率分布直方图如图所示,则其中每天在校平均开销在 [50,60]元的学生人数为 ________.
答案
150
解析 由频率分布直方图,得
每天在校平均开销在 [50,60] 元的学生的频率为
1- (0.01+ 0.024+0.036)× 10=0.3,
∴ 每天在校平均开销在 [50,60] 元的学生人数为
500× 0.3= 150.
15.如图是某市某小区 100 户居民 2015 年月平均用水量 (单位:t)的频率分布直方图的一部分,
则该小区 2015 年的月平均用水量的中位数的估计值为
________.
答案 解析
2.01
由题图可知,前五组的频率依次为
0.04,0.08,0.15,0.22,0.25,因此前五组的频数依次为 50 个数与第 51 个数的算术平均数,而前四组的频数
1 个数与第 2 个数的算术平均数, 中位数
2.01.
4,8,15,22,25 ,由中位数的定义,应是第
和为 4+ 8+ 15+ 22= 49,所以中位数是第五组中第
1
1
× (2.5-2)] ≈ 2.01,故中位数的估计值是
是 2[2 +2+ 24
16. (2018 芜·湖模拟 )某校开展“爱我家乡”演讲比赛, 9 位评委给小明同学打分的分数如茎
91,复核员在复核时, x= ________.
叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为 发现有一个数字在茎叶图中无法看清,若记分员计算无误,则数字
答案
1
由题意知,去掉一个最低分
88,
94,
解析
若最高分为 94 时,去掉最高分
余下的 7 个分数的平均分是
91,
即 × (+ + 92+ 93+ 90+ x+ 92+ 91)=91, 7
1
解得 x= 1;
若最高分为 (90+ x)分,去掉最高分 90+ x,
则余下的 7 个分数的平均分是
1
7× (++ 92+93+ 92+ 91+ 94)≠ 91,不满足题意.