四个分布:正态分布卡⽅分布F分布T分布
正态分布:
正态分布(Normal distribution)⼜名⾼斯分布(Gaussiandistribution),若随机变量X服从⼀个数学期望为µ、⽅差为σ^2的⾼斯分布,记为N(µ,σ^2)。其概率密度函数为正态分布的期望值µ决定了其位置,其标准差σ决定了分布的幅度。我们通常所说的标准正态分布是µ = 0,σ= 1的正态分布。
当µ=0,σ=1时,正态分布就成为标准正态分布N(0,1)。概率密度函数为:
正态分布的密度函数的特点是:关于µ对称,并在µ处取最⼤值,在正(负)⽆穷远处取值为0,在µ±σ处有拐点,形状呈现中间⾼两边低,图像是⼀条位于x轴上⽅的钟形曲线。
卡⽅分布:
若n个相互独⽴的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布N(0,1)(也称独⽴同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平⽅和构成⼀新的随机变量,其分布规律称为分布(chi-squaredistribution)。其中参数n称为⾃由度(通俗讲,样本中独⽴或能⾃由变化的⾃变量的个数,称为⾃由度),正如正态分布中均值或⽅差不同就是另⼀个正态分布⼀样,⾃由度不同就是另⼀个分布。记为。 分布的均值为⾃由度 n,记为 E( ) = n; 分布的⽅差为2倍的⾃由度(2n),记为 D( ) = 2n。
从卡⽅分布图可以看出:卡⽅分布在第⼀象限内,卡⽅值都是正值,呈正偏态(右偏态),随着参数 n 的增⼤;卡⽅分布趋近于正态分布;随着⾃由度n的增⼤,卡⽅分布向正⽆穷⽅向延伸(因为均值n越来越⼤),分布曲线也越来越低阔(因为⽅差2n越来越⼤)。
t分布:
⾸先要提⼀句u分布,正态分布(normal distribution)是许多统计⽅法的理论基础。正态分布的两个参数µ和σ决定了正态分布的位置和形态。为了应⽤⽅便,常将⼀般的正态变量X通过u变换[(X-µ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为µ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。根据中⼼极限定理,通过抽样模拟试验表明,在正态分布总体中以固定 n 抽取若⼲个样本时,样本均数的分布仍服从正态分布,即N(µ,σ)。所以,对样本均数的分布进⾏u变换,也可变换为标准正态分布N (0,1)。
由于在实际⼯作中,往往σ(总体⽅差)是未知的,常⽤s(样本⽅差)作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。假设X服从标准正态分布N(0,1),Y服从卡⽅ (n)分布,那么Z=X/sqrt(Y/n)的分布称为⾃由度为n的t分布,记为 Z~t(n)。
可以看出,t分布以0为中⼼,左右对称的单峰分布;t分布是⼀簇曲线,其形态变化与n(确切地说与⾃由度ν)⼤⼩有关。⾃由度ν越⼩,t分布曲线越低平;⾃由度ν越⼤,t分布曲线越接近标准正态分布(u分布)曲线。
F分布:
设X、Y为两个独⽴的随机变量,X服从⾃由度为n的卡⽅分布,Y服从⾃由度为m的卡⽅分布,这两个独⽴的卡⽅分布除以各⾃的⾃由度以后的⽐率服从F分布。即:
F分布是⼀种⾮对称分布;它有两个⾃由度,即n-1和m-1,相应的分布记为F( n–1,m-1), n-1通常称为分⼦⾃由度, m-1通常称为分母⾃由度;F分布是⼀个以⾃由度(n-1)和(m-1)为参数的分布族,不同的⾃由度决定了F 分布的形状。