Motivation
假设我们有个在参数 θ 下的正态分布 q。我们想要求解下面这样一个问题
θminEq[f(x)]
其中 Eq[f(x)] 的意思是求满足 q 分布下的随机变量函数 f(x) 的均值,而最外层的 minθ 则是求使得该均值最小时的 θ
有一种做法就是直接对该期望求 θ 的导数 ∇θEq[f(x)]
∇θEq[f(x)]=∇θ∫qθ(x)f(x)dx=∫f(x)∇θqθ(x)qθ(x)qθ(x)dx(积分变量是x)=∫qθ(x)∇θlogqθ(x)f(x)dx(Log Derivative Trick)=Eq[f(x)