· 3 min read
雅可比(Jacobi)矩阵、海塞(Hessan)矩阵
· 3 min read
多元函数的极值 最大值与最小值
· 4 min read
极大似然估计
· 9 min read
Maximum Likelihood Estimation(MLE) 极大似然估计,又被称作最大似然估计。其可在给定概率分布模型的条件下用于模型参数的估计,即所谓的参数估计
基本原理
对于一个常见的随机变量 ,其中的 是表示随机变量, 是该概率分布模型的模型参数。在不同的模型下有各自的模型参数,比如 二项分布(This page is not published) ,正态分布(This page is not published) 的 。
正态分布
连续型随机变量 如果满足如下密度函数
Nabla 算子与 Laplace 算子
· 3 min read
Gramian 矩阵
· 2 min read
info
在线性代数中,内积空间中一族向量 的格拉姆矩阵(Gramian matrix、Gram matrix 或 Gramian)是内积的 埃尔米特矩阵,其元素由 给出。
性质
warning
格拉姆矩阵是 半正定(This page is not published) 的,反之每个半正定矩阵是某些向量的格拉姆矩阵。这组向量一般不是惟一的:任何 正交基 的格拉姆矩阵是单位矩阵。
理解协方差矩阵
· 9 min read
Cloudflare Tunnel 穿透
· 2 min read
Gaussian Random Fields
· 2 min read
Spatiotemporal Model
假设我们能够测量在定义空间 位置 以及时间 处的温度 .但是每次测量都会引入一些误差,表达为:
这里的 就是未知的温度函数, 是测量误差。这个测量误差可以被建模成随机变量。所以对于每个点 的测量误差是一个随机变量。随机变量可以写成集合:
梯度下降
· 3 min read
假设我们想搜索光滑函数 的最小值,常见的方案是梯度下降(Gradient Descent),即按照如下格式进行迭代:
如果 关于 的凸的,那么梯度下降通常能够找到最小值点;相反,则通常只能收敛到一个 “ 驻点 “——即梯度为 0 的点,比较理想的情况下能收敛到一个极小值(局部最小值)点。这里没有对极小值和最小值做严格区分,因为在深度学习中,即便是收敛到一个极小值点也是很难得的了。
Why?