请勿使用手机竖屏浏览该文章,否则会遇到算式显示不全的BUG我懒得改了
随机变量的数学特征
数学期望/均值
离散型
E(X)=μ=k=1∑∞xkpkE[g(x)]=k=1∑∞g(xk)pk
连续型
E(X)=μ=∫−∞∞xf(x)dxE[g(x)]=∫−∞∞g(x)f(x)dx
常见分布
X∼π(λ)⇒E(X)=λX∼U(a,b)⇒E(X)=2a+bx∼exp(θ)⇒E(X)=θx∼b(n,p)⇒E(X)=np
方差
D(X)=σ2=E{[X−E(X)]2}=E(X2)−[E(X)]2
标准化变量(期望为0,方差为1)
X∗=σX−μ
常见分布
X∼π(λ)⇒D(X)=λX∼U(a,b)⇒D(X)=12(b−a)2x∼exp(θ)⇒D(X)=θ2x∼b(n,p)⇒D(X)=np(1−p)
切比雪夫不等式
P{∣X−μ∣<ε}≥1−ε2σ2
协方差与相关系数
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)Cov(X,Y)=E{[X−E(x)][Y−E(Y)]}=E(XY)−E(X)E(Y)ρXY=D(X)D(Y)Cov(X,Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)⇒f(x,y)=2πσ1σ21−ρ21exp{2(1−ρ2)−1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]}ρ=ρXYCov(X,Y)=ρσ1σ2
大数定律及中心极限定理
弱大数定理/辛钦大数定理
∀ε>0,n→∞limP{∣n1k=1∑nXk−μ∣<ε}=1Xˉ=n1k=1∑nXk⟶Pμ
伯努利大数定理
∀ε>0,n→∞limP{∣nfA−p∣<ε}=1
独立同分布的中心极限定理
Yn=nσ∑k=1nXk−nμ⇒n→∞limP{Yn≤x}=∫−∞x2π1e−2t2dt=Φ(x)
Yn=σ/nn1∑k=1nXk−μ=σ/nXˉ−μ≈N(0,1)⇒Xˉ≈N(μ,σ2/n)
棣莫弗-拉普拉斯定理
ηn∼b(n,p)⇒n→∞limP{np(1−p)ηn−np≤x}=Φ(x)
样本及抽样分布
样本均值
Xˉ=n1i=1∑nXi
样本方差
S2=n−11i=1∑n(Xi−Xˉ)2=n−11(i=1∑nXi2−nXˉ2)
样本k阶矩
Ak=n1i=1∑nXik⟶Pμk=E(Xk)
样本k阶中心矩
Bk=n1i=1∑n(Xi−Xˉ)k
χ2分布(不对称)
χ2=i=1∑nXi2∼χ2(n)χ12∼χ2(n1),χ22∼χ2(n2)⇒χ12+χ22∼χ2(n1+n2)E(χ2)=nD(χ2)=2n
t分布(对称)
X∼N(0,1),Y∼χ2(n)⇒t=Y/nX∼t(n)t1−α(n)=−tα(n)when n>45,tα(n)≈zα
F分布(不对称)
U∼χ2(n1),V∼χ2(n2)⇒F=Vn1Un2∼F(n1,n2)F1∼F(n2,n1)F1−α(n1,n2)=Fα(n2,n1)1
正态总体的样本均值与样本方差的分布
E(Xˉ)=μD(Xˉ)=σ2/nE(S2)=σ2
正态样本中
Xˉ∼N(μ,nσ2)⇔σ/nXˉ−μ∼N(0,1)σ2(n−1)S2∼χ2(n−1)S/nXˉ−μ∼t(n−1)
双正态样本中
S22σ12S12σ22∼F(n1−1,n2−1)when σ12=σ22=σ2,Swn11+n21(Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2)Sw=n1+n2−2(n1−1)S12+(n2−1)S22
参数估计
矩估计
μ^=Xˉσ2^=n1i=1∑n(Xi−Xˉ)2
最大似然估计
L(x1,x2,...,xn;θ^)=θ∈ΘmaxL(x1,x2,...,xn;θ)
μ的置信区间
(Xˉ±nσz2α)(Xˉ±nSt2α(n−1))
σ2的置信区间
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)
双总体μ1−μ2的置信区间
(Xˉ−Yˉ±z2αn1σ12+n2σ22)when σ12=σ22=σ2,(Xˉ−Yˉ±t2α(n1+n2−2)Swn11+n21)Sw=n1+n2−2(n1−1)S12+(n2−1)S22
双总体σ22σ12的置信区间
(S22S12F2α(n1−1,n2−1)1,S22S12F1−2α(n1−1,n2−1)1)
(0-1)分布参数p的置信区间
(2a−b±b2−4ac)a=n+z2α2b=−(2nXˉ+z2α2)c=nXˉ2
假设检验
分布拟合检验 皮尔逊定理
when n≥50,npi≥5i=1∑knpifi2−n∼χ2(k−1−r)(r is the number of estimated parameters)
偏度峰度
G1∼N(0,(n+1)(n+3)6(n−2))G2∼N(3−n+16,(n+1)2(n+3)(n+5)24n(n−2)(n−3))
方差分析及回归分析
单因素试验
总变差
ST=j=1∑si=1∑nj(Xij−Xˉ)2=SE+SASE=j=1∑si=1∑nj(Xij−X.jˉ)2SA=j=1∑si=1∑nj(X.jˉ−Xˉ)2=j=1∑snjx.jˉ2−nXˉ2
ST=j=1∑si=1∑njXij2−nT..2SA=j=1∑snjT.j2−nT..2SE=ST−SA
SE的统计特性
σ2SE∼χ2(n−s)n=j=1∑snjE(SE)=(n−s)σ2σ^2=n−sSE
SA的统计特性
σ2SA∼χ2(s−1)E(SA)=(s−1)σ2F=SE(s−1)SA(n−s)∼F(s−1,n−s)
一元线性回归
Sxx=i=1∑nxi2−nxˉ2Syy=i=1∑nyi2−nyˉ2Sxy=i=1∑nxiyi−nxˉyˉb^=SxxSxya^=yˉ−b^xˉQe=Syy−b^Sxyσ2Qe∼χ2(n−2)σ^2=n−2Qe
线性假设的显著性(b=0)检验
σ^b^−bSxx∼t(n−2)
μ0(x)=a+bx0的置信区间
(Y0^±t2α(n−2)σ^n1+Sxx(x0−xˉ)2)
μ0(x)=a+bx0的预测区间
(Y0^±t2α(n−2)σ^n1+1+Sxx(x0−xˉ)2)