借用 FGSM 中的对抗样本生成方式,对抗扰动通过如下公式生成:
δ=ϵsign(∇xJ(θ,x,y))
其中 ϵ 是扰动的无穷范数约束条件 ∥δ∥∞≤ϵ,分析的重点是符号矩阵 sign(∇xJ(θ,x,y))。
假设该符号矩阵为实矩阵 Am×n。在黑盒设定下,关于该矩阵的假设几乎一无所知。
矩阵分解
我们知道对于一个稠密 m×n 矩阵来说,我们可以使用 SVD 进行分解,即
A=UΛV∗=Uλ1000λ20……λr00…V∗
其中 Um×m,Vn×n∗ 都是正交矩阵 (扩展到复数是酉矩阵,我们只考虑实数,所以是正交矩阵),Λ 是 m×n 阶对角矩阵。Λ 对角线上的元素为 A 的奇异值。
进一步的,有如下推导:
A=====Uλ1000λ20……λr00…V∗U[λ1E11+λ2E22+⋯+λrErr]V∗λ1UE11V∗+λ2UE22V∗+⋯+λrUErrV∗λ1S1+λ2S2+⋯+λrSri=1∑rλiSi
其中的 Err 是一个 m×n 在 [i=r,j=r]=1 的矩阵。
就此,对抗扰动矩阵被分解为了 r 个 m×n 矩阵 “ 权重 ” 和形式,而权重就是奇异值。
Si 矩阵分析
可以证明 Sr 矩阵的秩为 1
矩阵 Err 是一个对角矩阵,它的第 r 行和第 r 列元素为 1,其他元素为 0。也就是说:
Err=00⋮000⋮0……⋱…00⋮1因此,矩阵 Sr 可以表示为:
Sr=UErrV∗=U[:,r]V[r,:]∗=U[:,r]⋅V[r,:]∗=u⊗v从这个式子可以看出,矩阵 Sr 是两个向量的外积 (准确来说是张量积) 的形式,所以得到的矩阵的秩必定为 1。
先假设 S1,S2,…,Sr 线性相关,即存在全非零常数 c1,c2,…,cr,使得:
c1S1+c2S2+⋯+crSr=0代入 Si 的定义
c1U[:]V[1,:]∗+c2U[:]V[2,:]∗+⋯+crU[:,r]V[r,:]∗=0首先由于 U,V∗ 的正交性,对于任意的 i=j 有:
{U[:,i]∗U[:,j]=0V[:,i]∗V[:,j]=0,i=j对上述方程左右两边分别乘以 U[:,k]∗ 和 V[k,:],其中 k 是任意的 1≤k≤r:
U[:,k]∗(c1U[:]V[1,:]∗+c2U[:]V[2,:]∗+⋯+crU[:,r]V[r,:]∗)V[k,:]=0通过分配律得到:
c1⋅U[:,k]∗U[:]⋅V[1,:]∗V[k,:]+c2⋅U[:,k]∗U[:]⋅V[2,:]∗V[k,:]+…+cr⋅U[:,k]∗U[:,r]⋅V[r,:]∗V[k,:]=0根据正交性,只有当 i=k 时, U[:,k]∗U[:,i]=1 且 V[i,:]∗V[k,:]=1。因此,所有 i=k 的项都为 0,剩下的只剩下第 k 项:
ck⋅U[:,k]∗U[:,k]⋅V[k,:]∗V[k,:]=0这进一步简化为:
ck⋅1⋅1=0因此 ck=0。
由于上述推导适用于任意 k ,因此 c1=c2=⋯=cr=0。
至此证明了上式只有全零解,所以 S1,S2,…,Sr 是线性无关的。
那么一个新的问题是:对于任意的非线性相关的矩阵 {Si} 是否存在系数 {λi} 使得上式成立。
因为对于一个 m×n 的矩阵,至少需要 mn 个基矩阵才能线性表示任意矩阵,而对于任意的 r 个矩阵显然不能张成整个矩阵空间,即任意 r 个矩阵是不一定能线性表示 Si 的。所以是不一定的。
但是对于 Si 的生成过程来说,Si 是通过两个向量 u∈Rm,vn∈Rn 取张量积得到。而 u 和 v 能够被 m+n 个数表示。
写成数学公式就是:
A===i=1∑rσi⋅Sii=1∑rσi⋅(um(i)⊗vn(i))i=1∑rσi⋅(um)1(i)⋅(vn)1(i)⋮(um)m(i)⋅(vn)1(i)⋯⋱⋯(um)1(i)