我们将整个 n 维空间看做为半径 R→+∞ 的球,考虑到夹角具有伸缩不变性,所以考虑 x12+x22+⋯+xn2≤1 和 x12+x22+⋯+xn2≤R2 是等价的,所以我们就在 n 维单位球里考虑这个问题就行了。
又注意到夹角具有旋转不变性,不妨设其中一个点为 A(1,0,0,⋯,0),另一个点为 B(x1,x2,⋯xn),其中 ∥{x1,x2,⋯xn}∥=1
我们将向量 x={x1,x2,⋯xn} 转化为超球坐标
⎩⎨⎧x1=cos(φ1)x2=sin(φ1)cos(φ2)x3=sin(φ1)sin(φ2)cos(φ3)⋮xn−1=sin(φ1)⋯sin(φn−2)cos(φn−1)xn=sin(φ1)⋯sin(φn−2)sin(φn−1)
这里最后的一个 φn−1∈[0,2π),其余的 φ∈[0,π]。此时,A,B 的夹角为
cosΘ=x12+x22+⋯+xn2x1=cos(φ1)
也就是说二者的夹角正好为 φ1,那么,A,B 的夹角 Θ 不超过 θ 的概率是:
Pn{Θ≤θ}=n 维超球面上的全积分 n 维超球面上 φ1 不超过 θ 的积分
而 n 维超球面上的积分微元是 sinn−2(φ1)sinn−3(φ2)⋯sin(φn−2)dφ1dφ2⋯dφn−1,所以
Pn(Θ≤θ)=∫02π⋯∫0π∫0πsinn−2(φ1)sinn−3(φ2)⋯sin(φn−2)dφ1dφ2⋯dφn−1∫02π⋯∫0π∫0θsinn−2(φ1)sinn−3(φ2)⋯sin(φn−2)dφ1dφ2⋯dφn−1=n 维单位超球的表面积 (n−1) 维单位超球的表面积 ×∫0θsinn−2φ1dφ1=Γ(2n−1)πΓ(2n)∫0θsinn−2φ1dφ1
这表明 θ 的概率密度函数为
fΘ(θ)=dθdP{Θ⩽θ}=πΓ(2n−1)Γ(2n)sinn−2θ
这个函数长什么样子呢
另外如果需要 η=cos(θ) 的分布,这需要换元得到
fn(η)=Γ(2n−1)πΓ(2n)sinn−2(arccosη)dηdθ=Γ(2n−1)πΓ(2n)(1−η2)(n−3)/2
所以可以看到函数在 θ=2π 取到最大值,并且当 n→∞ 时,趋向于冲激函数,即:
n→∞limfΘ(θ)=δ(θ−2π)
另外我们还要考虑方差
Varn(θ)=Γ(2n−1)πΓ(2n)∫0π(θ−2π)2sinn−2θdθ
可以看到随着 n 的增大,方差越来越小,这意味着高维空间中的任意两个向量的夹角几乎集中在 2π 附近,换言之,高维空间中任意两个向量几乎都是垂直的。