题目标题

L1-norm 和 L2-norm

难度:初级

机器学习
参考解析

其实稀疏的根本还是在于 L0-norm 也就是直接统计参数不为 0 的个数作
为规则项,但实际上却不好执行于是引入了 L1-norm;而 L1norm 本质上是假
设参数先验是服从 Laplace 分布的,而 L2-norm 是假设参数先验为 Gaussian
分布,我们在网上看到的通常用图像来解答这个问题的原理就在这。
但是 L1-norm 的求解比较困难,可以用坐标轴下降法或是最小角回归法
求解。