预备知识
回顾 高斯分布 以及 混合模型 中的内容,独立的多元高斯分布为:
fx(x1,…,xk)=(2π)k∣Σ∣1e−21(x−μ)TΣ−1(x−μ)
在二维非奇异的情形下,我们有下面公式:
f(x,y)=2πσXσY1−ρ21e−2(1−ρ2)1[(σXx−μX)2−2ρ(σXx−μX)(σYy−μY)+(σYy−μY)2]
其中 ρ 是 X 和 Y 之间的相关系数,σX>0 并且 σY>0,我们假设 X,Y 之间是独立的 ρ=0,所以我们可以化简上述公式为:
f(x,y)=2πσXσY1e−21[(σXx−μX)2−2ρ(σXx−μX)(σYy−μY)+(σYy−μY)2]=2π∣Σ∣1e−21(x−μ)TΣ−1(x−μ)
其中
μ=(μYμX),Σ=(σX200σY2)
单高斯模型求曲线积分
我们有曲线 L,则求其第一类曲线积分:
∫Lf(x,y)ds
假设曲线有参数方程的形式,我们有:
L:{x=φ(t)y=ψ(t)∫Lf(x,y)ds,α≤t≤β=∫αβf(φ(t),ψ(t))参数方程的弧微分 ds(φ′(t))2+(ψ′(t))2 dt
如果有函数形式,我们有:
L:{x=xy=ψ(x)∫Lf(x,y)ds,a≤x≤b=∫abf(x,ψ(x))函数的弧微分 ds1+(ψ′(x))2 dx
假设曲线是一个过两点 (x1,y1),(x2,y2) 的直线,则对于曲线 L 我们有下面参数方程:
L:{x=x1+t(x2−x1)y=y1+t(y2−y1),0≤t≤1求其曲线积分
∫Lf(x,y)ds=∫01f(φ(t),ψ(t))(φ′(t))2+(ψ′(t))2dt=∫01f(φ(t),ψ(t))(x1−x2)2+(y1−y2)2dt
记 Δx=x2−x1,Δy=y2−y1。
二元高斯分布为:
f(x)=2π∣Σ∣1e−21(x−μ)TΣ−1(x−μ)
其中设:
x(t)=(ψ(t)φ(t))=(y1+tΔyx1+tΔx)
则:
x(t)−μ=(y1+tΔy−y0x1+tΔx−x0)
二次型为:
Q(t)=(x(t)−μ)TΣ−1(x(t)−μ)
我们令 σX=σY=k,展开得到:
Q(t)=k2(x1−x0+tΔx)2+(y1−y0+tΔy)2
曲线积分为:
∫Lf(x,y)ds=2πk2Δx2+Δy2∫01exp(−2Q(t))dt
由于 Q(t) 是关于 t 的二次函数,可以表示为:
Q(t)=At2+Bt+C
其中:
ABC=k2Δx2+Δy2=2k2Δx(x1−x0)+Δy(y1−y0)=k2(x1−x0)2+(y1−y0)2
因此,积分变为:
∫01exp(−2At2+Bt+C)dt
完全平方公式:
At2+Bt+C=A(t+2AB)2+(C−4AB2)
令:
D=C−4AB2
则积分变为:
e−D/2∫01exp(−2A(t+2AB)2)dx
令 μ=t+2AB,则
∫2AB1+2ABexp(−2Au2)du
可以表示成误差函数 erf 的形式:
A2[Φ(A(1+2AB))−Φ(A⋅2AB)]
其中
Φ(z)=2π1∫−∞ze−t2/2dt 。
所以最后曲线积分为:
2πk2Δx2+Δy2⋅A2e−D/2[Φ(A(1+2AB))−Φ(A⋅2AB)]
其中参数为:
⎩⎨⎧Δx=x2−x1Δy=y2−y1A=k2Δx2+Δy2B=2k2Δx(x1−x0)+Δy(y1−y0)C=k2(x1−x0)2+(y1−y0)2D=C−4AB2
其中 Φ 是标准正态分布的累积分布函数 (CDF).
拓展到混合模型中
实际上每个二元高斯分布是独立的,所以依次相加即可。