复旦大学公共卫生学院
2006~2007学年第一学期期末考试试卷
□B卷
课程名称:_卫 生 统 计 学 课程代码:__357.014.1.01_ 开课院系:_公共卫生学院____ 考试形式: 闭卷
姓 名: 学 号: 专 业:预防医学 题 号 得 分 一 二 三 四 总 分 一、是非题(每题3分,答错倒扣1分)
( 装订线内不要答题)1、末端有不确定数值的资料可用中位数反映其离散趋势。( ) 2、用x2.58s制定出参考值范围后,不在这个范围的人一定是病人。( )
3、若以舒张压 12.7kPa为诊断为高血压,调查某地1000人,根据各人的血压,按此标准进行诊断,汇总诊断结果为:其中有10名高血压患者,有990名非高血压患者。该资料为计量资料。( )
4、某人用成组t检验对多个总体的均数进行两两比较,设=0.05,其结果为所有的P<0.05,则可以认为不存在第II类错误。( ) 5、完全随机设计的方差分析要求每组样本量相同。( )
6、对于π接近0并且样本量不太大的情况,总体率的95%可信区间可根据正态分布原理求得。( )
7、婴儿死亡率(年)实际上是一个构成比(proportion)指标。( ) 8、方差分析中多个样本均数间的多重比较与用Student’s t检验对各均数作两两比较是一样的。( )
1
9、多组秩和检验的无效假设(H0)是多组资料来自同一总体分布。( ) 10、由于相关系数r和回归系数b的假设检验是对等等价的,因此回归系数越小,则可认为两变量相关关系越不密切。( )
二、选择题(每题3分, 答错倒扣1分,不答不倒扣分)
1、正常成年男子的血铅含量为偏态分布资料,对数变换后呈正态分布。欲描述血铅的平均水平宜用( )
A 原始数据的算术均数 B 原始数据的几何均数 C 原始数据的中位数 D 原始数据的标准差
2、下列关于标准误的说法,_________是错误的?
A 标准误可反映样本均数间的离散程度 B 标准误也可反映样本均数与总体均数的差异 C 标准误是总体均数的标准差 D 标准误说明抽样误差的大小
3、为了比较两个民族的头发中某金属元素的平均含量是否有差别,在两个民族的人群中分别随机抽了10个对象,测定了这20个对象的该金属元素的含量。若资料不符合做t检验的条件,也无法通过数据转换满足t检验的条件,则 。
A 可考虑改用完全随机设计的方差分析 B 可考虑用两样本比较的秩和检验 C 可考虑Pearson 2进行检验 D 可考虑用u检验
4、ν 越小,t0.05,ν 值的变化规律是
A 越大于1.96 B越小于1.96 C 越接近1.96 D越接近t0.05 ,∞
2
5、12名妇女分别用两种测量肺活量的仪器测得最大呼气率(1/min),比较两种方法检测的平均水平有无差别,如果资料满足正态性,则可进行( ) A 完全随机设计u检验 B 完全随机设计t检验 C 配对设计u检验 D 配对设计t检验
6、关于秩和检验,下列哪项是正确的 A 要求两组数据呈正态分布且方差齐 B 适用范围广且检验效能高 C 原始资料不能是数值变量
D 若数据满足t检验的条件,检验效能低于t检验
7、已知男性的钩虫感染率高于女性,今欲比较甲、乙两乡居民钩虫感染率,但甲乡人口女多于男,而乙乡男多于女。对于两个乡的普查结果,选择适当的比较方法是
A 两个率比较的检验
2
B 两个率比较的μ检验 D 对性别进行标化后再比较
C 不具有可比性,不能比较
8、在计数资料的假设检验中,对于两个率比较的统计假设为H0:1=2,备选
假设H1:12,=0.05,在大样本的情况下,所有理论数>5,用Pearson 2进行检验,请问:下列哪一个说法是错误的 。 A 统计量2服从自由度为1的2分布 B 统计量2>临界值0.05,1,则拒绝H0
C H0成立时,统计量2服从自由度为1的2分布 D P值<0.05, 则拒绝H0
3
29、某研究者确定所抽的血液样本中甘油三脂水平与动脉硬化程度之间的相关系
数为1.5462。据此你将作出如下哪条结论 A 甘油三脂水平是动脉硬化的良好预测指标 B甘油三脂水平不是动脉硬化的良好预测指标 C 高水平甘油三脂会导致动脉硬化症 D 该研究者所确定的相关系数是错误的
10、要通过一份人口资料计算10岁的期望寿命,
e10_____________
A 和年龄别死亡率没有关系 B 受[0~10)岁死亡率影响 C 受[0~9)岁死亡率的影响 D 受10岁以后的死亡率影响
三、简答题(共20分)
1、标准正态分布和t分布有何区别和联系?并叙述两者的应用范围(6分)
2、线性回归对资料的要求是什么?Pearson相关对资料的要求是什么?。(7分) 3、两组计量资料的均数比较,并满足成组t检验的条件,用双侧的成组t检验。=0.05,若差别有统计学意义,请问能否根据该资料的统计分析结果推断哪一组对应的总体均数大于另一组所对应的总体均数吗?为什么?(7分)
四、统计分析题(每题10分,请按统计分析报告格式完成:统计描述、统计分析推断并作出统计结论)
1、为了研究铅作业与工人尿铅含量的关系,随机抽查4种作业工人的尿铅含量结果如下,问4种作业工人人群的尿铅平均含量有无差别?
4种铅作业工人尿铅含量(mg/L)测定结果
组别 铅作业组 调离铅作业组 非铅作业组 对照组
0.10 0.18 0.14 0.03
0.28 0.00 0.02 0.01
0.40 0.20 0.05 0.08
血浆肾素活性 0.18 0.14 0.02 0.06
0.24 0.23 0.13 0.00
0.14 0.12 0.10 0.03
0.16 0.13 0.04 0.07
0.15 0.11 0.01 0.08
1)请叙述下列的结果,并说明在什么情况下适用?
| Summary of y
4
group | Mean Std. Dev. Freq. ------------+------------------------------------ 1 | .20625 .09694439 8 2 | .13875 .06998725 8 3 | .06375 .05208167 8 4 | .045 .03162278 8 ------------+------------------------------------ Total | .1134375 .09110821 32
Source SS df MS F Prob > F ----------------------------------------------------------------------- Between groups .131259379 3 .043753126 9.72 0.0001 Within groups .126062502 28 .004502232
----------------------------------------------------------------------- Total .257321881 31 .008300706 Bartlett's test for equal variances: chi2(3) = 7.8688 Prob>chi2 = 0.049
Comparison of y by group (Bonferroni) Row Mean-|
Col Mean | 1 2 3 ---------+--------------------------------- 2 | -.0675 | 0.324
3 | -.1425 -.075 | 0.001 0.201
4 | -.16125 -.09375 -.01875 | 0.000 0.056 1.000
2)请叙述下列结果,并说明在什么情况下适用? Test: Equality of populations (Kruskal-Wallis test) group _Obs _RankSum 1 8 206.00 2 8 161.50 3 8 90.50 4 8 70.00
chi-squared = 16.921 with 3 d.f. probability = 0.0007
chi-squared with ties = 16.958 with 3 d.f.
5
probability = 0.0007
3)对上面资料若要作完整的统计分析,请叙述相应的步骤。
2、用两种方法检查已经确诊的乳腺癌患者120名。甲法的检出率为60%,乙法检出率为50%,甲、乙两法一致的检出率为35%,试问两种方法何者为优?
附公式:
x01.t 2. Usx3.2x1x2s2x1s2x2
(AT)2 4. T2(AT0.5)2T
(adbc)2nA225. 6. n(1)
(ab)(cd)(ac)(bd)nRnC2(bc)27. 8.
bc(ab)(cd)(ac)(bd)22(adbcn/2)2n9. 2(bc1)2bcj 10. SS总=2XjijiijX
2211. SS组间=njXjX 12. SS组内XijXj
xixjSxixj 14. Sxixj13. LSDt.
11MS误差
nnji附统计用表
F界值表
χ2界值表
自由度 ν 1 2 3 4 5
6
分母 分子自由度ν1 ν2 2 3 4 25(0.05) 3.38 2.99 2.76 25(0.01) 5.57 4.68 4.18 26(0.05) 3.37 2.98 2.74 26(0.01) 5.53 4. 4.14 27(0.05) 3.35 2.96 2.73
概率(双侧) P= 0.05 3.84 5.99 7.81 9.49 11.07
27(0.01) 5.49 4.60 4.11 28(0.05) 3.34 2.95 2.71 28(0.01) 5.45 4.57 4.07 29(0.05) 3.33 2.93 2.70 29(0.01) 5.42 4.54 4.04
6 7 8 9 10
12.59 14.07 15.51 16.92 18.31
7
答 案
一、是非题
1、错 2、错 3、错 4、对 5、错 6、错 7、错 8、错 9、对 10、错
二、选择题
1、B 2、C 3、B 4、A 5、D 6、D 7、D 8、C 9、D 10、D
三、简答题(共20分)
1、标准正态分布与t分布的区别是
(1)曲线形状及曲线下面积分布不同
① 标准正态分布是一条概率密度分布曲线
② t分布是与自由度有关,不同的自由度对应不同的多条概念密度分布曲线,且中部面积分布较标准正态分布少,而两侧尾部面积分布较标准正态分布多 (2)应用不同
① 估计总体均数可信区间和t检验要用到t分布
② 标准正态分布应用广泛(如估计参考值范围,可信区间,各种假设检验,可作为很多统计方法的基础等)
标准正态分布与t分布的联系是:当ν→∞ 时,t分布趋向于标准正态分布(即以标准正态分布为极限)
2、线性回归对资料的要求是:固定X,Y服从正态分布,对应是残差服从正态分布,方差齐性。X可以精确测量或严格控制(不可作相关) Pearson相关对资料的要求是:X Y服从双变量正态分布
3、能推断某一组对应的总体均数大于另一组所对应的总体均数。理由如下: 双侧检验的t检验,在=0.05水平下,差别有统计学意义,即 |t| >t界值,由于可信区间能回答假设检验的问题,可有如下推导:
x1x2t2,Sx1x2u1u2x1x2t2,Sx1x2
两边除以Sx1x2得
8
x1x2Sx1x2t2,u1u2x1x2t,
2Sx1x2Sx1x2x1x2Sx1x2tt,t
u1u2tt,
2Sx1x22由Sx1x2即合并方差公式得知,其值>0, 故有
当tt2,时,0u1u2,得u1u2,
反之,则有u1u2
同时,如果已知X1>X2,也能得出相应结果。所以两组计量资料的均数比较,
并满足成组t检验的条件,用双侧的成组t检验。=0.05,若差别有统计学意义,是能根据该资料的统计分析结果推断哪一组对应的总体均数大于另一组所对应的总体均数的。
四、统计分析题答案
1、(1.1)第一张结果表显示该资料的描述性结果,包括均数、标准差等结果,以及方差分析结果。从表中可知完成随机设计的方差分析结果按=0.05水准,P<0.05,差异有统计学意义,但方差分析应满足正态、方差齐等条件,Bartlett’s检验结果为P=0.049,按=0.1水平,方差不齐,故应考虑其它途径。
(1.2)第二张表结果为Bonferroni两两比较结果,按资料分4组,校正应为/4*3/2=0.083,以此为检验水准,可知第1与第3以及第1与第4组,差异有统计学意义。
(2)该结果为秩和检验的Kruskal-Wallis 检验,其非校正与校正的P值均<0.05,差异有统计学意义,可以认为四组间总体分布不相同。 (3)对以上的资料若要进行完整的统计分析,其相应步骤大致为:
考察资料的性、正态性和方差齐性,满足、正态、方差齐,用完成随机设计的方差分析,若P<0.05,则进一步作两两比较,可用前面的Bonferroni但需对检验水准进行校正。
若资料满足、正态但方差不齐,或非正态则应考虑非参数检验方法。但需注意,若用秩和检验(如H检验 )P<0.05,用wilcox作两两秩和检验,但需校正检验水准。(当然也可以经变量变换,达到参数检验的条件)
若不满足性,则考虑可能是随机区组设计,要从随机区组设计的方差
9
分析入手。
2、⑴根据题意列出配对四格表 甲 法 检 出 未检出 合计
乙 法
检 出 42 18 60
未检出 30 30 60
合 计 72 48 120
⑵建立假设 H0:B=C H1:B≠C α=0.05 ⑶计算统计量 b+c>40,用配对2计算2=3
⑷确定P值,作出结论
P>0.05 , 按α=0.05水准,不拒绝H0,尚不能认为两法检出率不同。
10