正则化技巧有哪些?各自的作用是什么?

常用的正则化技巧主要包括:
一、L1正则化
L1正则通过添加|θ|到代价函数中来实现正则化。它的作用是:

  • 产生稀疏解(多参数变为0)
  • 选择最相关特征

L1正则化的效果等同于特征选择。

二、L2正则化
L2正则通过添加θ^2到代价函数中来实现正则化。它的作用是:

  • 防止模型过度复杂,降低方差
  • 控制特征权重,避免过拟合

L2正则化的效果等同于shrinkage。

三、Dropout
Dropout通过在网络中间随机关闭部分单元来实现正则化。它的作用是:

  • 防止单元过度依赖少量神经元
  • 强制网络学习更加稳固的特征

Dropout将神经网看作多颗网络的集合。

四、数据增强
通过对数据进行变换、翻转、Noise等操作来实现正则化。
它的作用是:

  • 增加模型所见数据的多样性
  • 模型可以学到不变的特征

数据增强强化模型的鲁棒性。

总的来说,正则化技巧的主要作用包括:

  1. L1正则化:选择最相关特征
  2. L2正则化:防止过拟合
  3. Dropout:防止过度依赖
  4. 数据增强:增加多样性

它们的技巧不同,但目的相同:
降低模型的复杂度,提高泛化能力。