重谈 L1 与 L2 正则
· 9 min read
L1 与 L2 的比较是一个老生常谈的问题
本文章想要回答下面这个问题
info
前文提到 、 正则都是想要降低模型的复杂度 (权重趋近 ),那么二者是否有倾重?或者说区别是什么?
L1- 正则化更稀疏
为了探究 和 正则化效果,设计了一个蒙特卡洛实验。
L1 与 L2 的比较是一个老生常谈的问题
本文章想要回答下面这个问题
前文提到 、 正则都是想要降低模型的复杂度 (权重趋近 ),那么二者是否有倾重?或者说区别是什么?
为了探究 和 正则化效果,设计了一个蒙特卡洛实验。
在 数学与计算机科学 中,尤其是在机器学习和逆问题领域中,正则化(regularization)是指为解决 适定性问题
或 过拟合
而加入额外信息的过程。[^1]
先来从损失函数的角度引入,机器学习训练的过程,就是要找到一个足够好的函数 用以在新的数据上进行推理。而为了定义这个好,我们引入了损失函数的概念。一般的,对于样本 和模型 ,有预测值 。而损失函数是定义在 上的二元函数 ,用来描述 和预测值之间的差距。一般来说,损失函数是一个有下确界的函数;当预测值和 足够接近,损失函数的值也会接经该下确界。