卫生统计考点及题型

来源:互联网 发布:2016哪里看淘宝大数据 编辑:程序博客网 时间:2024/04/29 08:56

  • 卫生统计考点及题型
    • 1常用概率分布
      • 1 正态分布
      • 2 二项分布
      • 3 泊松分布
      • 4 t分布
    • 2 参数区间估计
      • 1 t分布区间估计
      • 2 正态分布区间估计
    • 3假设检验
      • 1 假设检验的步骤
      • 2 t检验
        • 21 单样本资料t检验
        • 22 配对设计资料的t检验
      • 3 卡方检验
    • 4方差分析
      • 1 单因素方差分析
    • 5试验设计
    • 相关分析及回归分析
    • 2考题

卫生统计考点及题型

1、常用概率分布

1.1 正态分布

  • 正态分布密度函数:

    f(x)=12πez22

    Z=Xμσ

    Z N(0,1)Z服从均值为0,标准差为1的标准正态分布
    X N(μ,σ),X服从均值为μ,方差为σ的正态分布

  • 概率密度函数图:
    这里写图片描述

  • 累积概率密度:
    累积概率密度
  • 题目1
    某地1986年120名8岁男孩身高均数为 X¯=123.02cm,标准差为S=4.79cm,试估计8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;(2)身高在120cm-128cm占8岁男孩总数百分比;(3)该地80%男孩身高集中在哪个范围?
  • 题目2:
    调查某地120名健康女性血红蛋白,直方图显示其分布近似于正态分布,X¯=117.4(g/L),S=10.2(g/L),试估计该地健康女性血红蛋白的95%参考值范围。

1.2 二项分布

  • 二项分布的概率密度函数P(X)

    P(X)=CXnπX(1π)nx

    CXn=n!X!(nX)!

  • Binomial probability mass function and normal probability density function approximation for n = 6 and p = 0.5
    这里写图片描述

p的总体均数:μp=π
标准差:σp=π(1π)n

  • 题目1:
    已知某地钩虫感染率为6.7%,如果随机抽查150人,记样本钩虫感染率为p,求p的标准误σp
  • 题目2
    某地钩虫感染率13%,随机抽查当地150人,其中至多有2名感染钩虫的概率有多大?至少有2名感染钩虫的概率有多大?至少有20人感染钩虫的概率有多大?

1.3 泊松分布

  • Poisson分布的概率密度函数:

    P(X)=eλλXX!

    λ=nπ为Poisson分布的总体均数,X为观察单位内某稀有事件发生的次数;e为自然对数的底,为常数约等于2.71828。

    Poisson分布的总体均数和方差相等为λ

  • 题目1:
    某地居民脑血管疾病的患病率为150/100000,那么调查该地10000名居民中有2人患脑血管的概率有多大?至多有两人患脑血管疾病的概率有多大?至少有三人患脑血管疾病的概率有多少?

1.4 t分布

  • 从正态分布N(μ,σ2)的总体中随机抽样得到样本均数X¯也服从正态分布,记为X¯N(μ,σ2x¯)。对正态变量X¯作Z变换:

    Z=X¯μσx¯N(0,1)

  • 在实际工作中σx¯未知常用Sx¯来代替

    t=X¯μSX¯=X¯μS/nt,v=n1

  • S为样本标准差,
  • SX¯均数标准误(standard error of mean,SEM)反映抽样均值波动情况,可反映均数抽样误差的大小。
    抽样含量为小样本时服从t分布,标准正态分布是t分布的特例
    二项分布在nπn(1π)均大于5时候,以及Poisson分布在λ>=20都近似正态分布,用正态分布近似的方法处理数据可简化问题。

2、 参数区间估计

2.1 t分布区间估计

tα/2,v<Xμ¯SX¯<tα/2,v
X¯tα/2,vSX¯<μ<X¯+tα/2,vSX¯

SX¯=Sn

  • 题目:
    已知某地27名健康成年男子血红蛋白含量的 X¯=125g/L, S = 15g/L。试估计该地健康成年男子血红蛋白平均含量的95%和99%置信区间。

2.2 正态分布区间估计

σ已知总体均数μ的双侧(1α)置信区间:

(X¯Zα/2σx¯,X¯+Zα/2σx¯)

σ未知总体均数μ的双侧(1α)置信区间:
(X¯Zα/2Sx¯,X¯+Zα/2Sx¯)

σX¯=σnSX¯=Sn

  • 题目:
    某医师于2000年在某市随机抽取90名19岁的健康男性大学生,测量了他们的身高,得样本平均数为172.2cm, 标准差为4.5cm,估计该市2000年19岁健康男性大学生平均身高的95%,99%置信区间。

3、假设检验

3.1 假设检验的步骤

  • 建立假设检验,确定检验水准
  • 计算统计量
  • 确定p值,做出推断

3.2 t检验

3.2.1 单样本资料t检验

  • 定义:单样本t检验,实际上是推断该样本来自总体均数μ与已知的某一总体均数μ0(常为理论值或标准值)有无差异。
  • 零假设H0:μ=μ0
  • 统计量
    t=X¯μ0S/n
  • 自由度 v = n -1
  • 如果P值小于α,就拒绝零假设;如果P值不小于α,则不拒绝零假设。

3.2.2 配对设计资料的t检验

  • H0:μd=0,即差数的总体均数为0
  • H0成立时,检验统计量为:
    t=d¯0Sd/nt(v),v=n1

    d¯为差值的均数,Sd为差值的样本标准差,n为对子数。如果t值相应的P值小于给定的α,拒绝H0

3.3 卡方检验

  • 1、建立假设检验,确定检验水平
  • 2、计算χ2统计量和自由度
  • 3、确定P值,做出推断

χ2=(AT)2T

v=k1s

A为实际值,T为理论值;k为分组个数,s一般取2
T = n * p(条件1) * p(条件2),n为总样本数目

当理论频数小于5时,采用下式矫正

χ2=(|AT|0.5)2T

  • 题目:P159
    病情相似的169名消化道患者随机分成两组,分别用洛赛克和雷尼替丁治疗,四周后效果如下表。问两种药物治疗消化道溃疡的愈合率有无差别。
处理 愈合 未愈合 洛赛克 64 21 雷尼替丁 51 33

4、方差分析

4.1 单因素方差分析

假设一共有k个分组
- 方差分析

SS=i=1kj=1(XijX¯)2

MS=SSv

v=N1

SS=i=1kni(Xi¯X¯)2

MS=SSv

v=k1

SS=i=1kj=1(XijXi¯)2

MS=SSv

v=Nk

F=MSMS

5、试验设计

  • 试验设计

  • 样本选取

  • 随机区组试验设计

相关分析及回归分析

  • 相关分析

  • 线性回归

2、考题

  • 标准差与标准误的区别与联系

  • 误差的概念

  • 概率与频率的区别

  • 常用的试验设计方法

  • Pearson相关与Spearman相关有什么不同

  • 分类变量 截尾数据

这里写图片描述

方差分析的基本思想用途及试用条件

均数抽样误差及均数

p值含义,小概率事件

随机区组设计和完全随机设计的随机设计之间的不同

这里写图片描述