假设有数据:
X=(x1,x2,⋯,xN)T=x1Tx2T⋮xNT=x11x21⋮xN1x12x32⋮xN2……⋱…x1px2p⋮xNpN×P
其中 xi∈Rp,xi∼N(μ,Σ),参数为 θ=(μ,Σ)
单变量高斯分布
对于单变量的高斯分布 N(μ,σ2),即 p=1,其概率密度函数为
p(x)=2πσ1exp{−2σ2(x−μ)2}
我们希望通过观察到的数据来计算参数 θ 的值,使用 极大似然估计 进行估计,似然函数可以写为
logp(X;θ)=logi=1∏Np(xi;θ)=i=1∑Nlogp(xi;θ)=i=1∑N[log2π1+logσ1−2σ2(xi−μ)2]
求解参数
对于 μ 的估计实际上就是:
μMLE=argμmaxlogp(X;θ)=argμmaxi=1∑N−2σ2(xi−μ)2(省略无关项)=argμmini=1∑N(xi−μ)2对其求导得到:
∂μ∂i=1∑N(xi−μ)2=i=1∑N2⋅(xi−μ)⋅(−1)=0解得:
i=1∑NxiμMLE=i=1∑Nμ=N1i=1∑Nxi
σMLE2=argσmaxlogp(X;θ)=argσmaxi=1∑N[logσ1−2σ2(xi−μ)2]求导得:
∂σ∂logp(x;θ)=i=1∑N−σ1−21(xi−μ)2(−2)σ−3=0解得:
i=1∑Nσ2=i=1∑N(xi−μ)2σMLE2=N1i=1∑N(xi−μ)2而这里是含 μ 的,所以是 μMLE.
σMLE2=N1i=1∑N(xi−μMLE)2
无偏性
无偏估计就是 E(x^)=x,下面我们分别判断上述 μMLE,σMLE 的无偏性。
E[μMLE]=E[N1i=1∑Nxi]=N1i=1∑NE[xi]=N1Nμ=μ
可以化简一下 σ 的估计
σMLE2=N1i=1∑N(xi−μMLE)2 =N1i=1∑N(xi2−2μMLExi+μMLE2) =N1i=1∑Nxi2−2⋅μMLE⋅μMLEN1i∑Nxi+N1i=1∑NμMLE2 =N1i=1∑N(xi2−μMLE2)
于是期望是
E[σMLE2]=E[N1i=1∑N(xi2−μMLE2)]=E[N1i=1∑N(xi2−μ2)−(μMLE2−μ2)]=E[N1i=1∑N(xi2−μ2)]−E[(μMLE2−μ2)]=N1i=1∑NE[xi2−μ2]−E[μMLE2−μ2]=N1i=1∑NVar(xi)=σ2E[xi2]−μ2−E[μMLE2−μ2](Var(X)=E[X2]−E2(X))=σ2−E[μLE2−μ2]=σ2−E[μLE2]−E[μ2]=σ2−E[μLE2]−μ2=σ2−Var[μMLE]E[μLE2]−E2[μMLE]=σ2−Var[N1i=1∑Nxi]=σ2−N21i=1∑NVar[xi](Var(CX)=D2Var(X))=σ2−N21Nσ2=NN−1σ2
所以,