深度学习的核心原理主要包含以下几个方面:
一、多层表示
通过多层神经网络,深度学习可以学习多层次的表示。
初步学习低级特征,逐渐提取高级特征。
二、非线性转换
每个层使用非线性激活函数,实现非线性转换。
通过多次非线性转换,学习高纬非线性映射。
三、端到端学习
深度结构可以端到端地学习任务,直接映射输入到输出。
无需人工设计中间表示。
四、误差反向传播
使用反向传播算法优化网络参数,不断逼近目标。
自动学习多层表示。
五、数据驱动
深度学习主要依赖大量数据进行训练。
数据可以驱动网络学习有效特征。
六、现有解决
通过上述方式,深度学习可以解决视觉、语音等复杂问题。
下图展示了深度学习结构:
总的来说,深度学习的主要原理在于:
- 多层表示(多层网络)
- 非线性转换(非线性激活)
- 端到端学习(输入到输出)
- 误差反向传播 (训练网络)
- 数据驱动(依赖大量数据)
通过:
- 多层次表示
- 非线性变换
- 端到端学习
- 误差优化
- 数据驱动
深度学习得以实现。