【八股文-机器学习】推导反向传播算法

1. 反向传播基本方程

为了便于计算,我们定义l层的第j个神经元上的误差为:
图片说明

反向传播基本方程:
图片说明

  • BP1表示了输出层的误差如何计算
  • BP2表示了如何根据l+1层的误差来计算上一层也就是l层的误差
  • BP3表示了如何根据计算出的每层上每个神经元上的误差来计算参数偏置图片说明 的梯度下降方向
  • BP4表示了如何根据已经计算出的每层每个神经元上的误差来计算参数权重 的梯度下降方向。

1.1 BP1推导
图片说明

1.2 BP2推导
采用链式法则
图片说明
其中
图片说明
求导即可得:
图片说明
带入上式即可得到:
图片说明
通过上述两个式子,进行反向传播依次求取即可完成误差图片说明 的全部计算,然后基于计算结果计算参数的梯度下降方向

1.3 BP3推导
图片说明
采用链式法则将 带入即可得到
图片说明
1.4 BP4推导
同样采用链式法则
图片说明

2. 反向传播算法

由上述公式我们可以总结出神经网络训练过程,主要分为前向传播和反向传播两个过程,如下所示:
图片说明

全部评论

相关推荐

2025-12-19 15:04
门头沟学院 Java
小肥罗:hr爱上你了,你负责吗哈哈
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务