登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
卷积基础知识(四)池化操作与卷积中的反向传播 ...
卷积基础知识(四)池化操作与卷积中的反向传播
[ 复制链接 ]
闰咄阅
昨天 19:26
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
此分类用于记录吴恩达深度学习课程的学习笔记。
课程相关信息链接如下:
原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai
github课程资料,含课件与笔记:吴恩达深度学习教学资料
课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案
本篇为第四课的第一周内容,1.9到1.11的内容,同时也是本周理论部分的最后一篇。
本周为第四课的第一周内容,这一课所有内容的中心只有一个:
计算机视觉
。应用在深度学习里,就是专门用来进行图学习的模型和技术,是在之前全连接基础上的“特化”,也是相关专业里的一个重要研究大类。
这一整节课都存在大量需要反复理解的内容和机器学习、数学基础。
因此我会尽可能的补足基础,用比喻和实例来演示每个部分,从而帮助理解。
本篇的内容关于
池化操作与卷积中的反向传播
,是对本周内容的最后补完,本篇之后,我们就可以对卷积神经网络的基本组件与传播过程有一个较完整的认知。
1. 池化层(pooling layer)
除去卷积层和全连接层,池化层也是卷积神经网络的一大基石,不要被这个名字吓到,它的原理反而是最简单的。
常见的池化分为两种:
最大池化和平均池化。
使用方法并不难,我们直接摆出来:
最大池化:不计算,直接使用窗口最大值作为结果的卷积操作。
平均池化:用窗口所有像素的平均值作为结果的卷积操作。
先来看最大池化,我们通过课程里的例子补充一些细节:
现在我们知道了最大池化怎么用了,问题紧接着就来了,
这个操作是用来干嘛的?
我们继续:
你可能发现了一个 bug :
那万一重要特征反而是被一堆大像素包围的小像素呢?这样不是反而把最重要的特征扔了吗?
平均池化可以缓解这种现象:
实际上,
池化最大的作用就是在卷积神经网络中减少特征图的空间尺寸来降低计算复杂度,同时保留特征信息。
而对于怎么池化更好更合适,还是要在具体任务中不断尝试。
此外,
对于输出特征图的大小计算,卷积的输出公式在这里仍然适用:
\[\text{输出尺寸}=\left\lfloor\frac{n - f + 2p}{s}\right\rfloor + 1, 注:\lfloor向下取整\rfloor \]
而对于多通道的池化处理,也和卷积核的逻辑相同,确保和输入图像的通道数相等
。
最后强调一点:
你会发现,池化层只有人工设置的超参数,没有任何参与传播的参数,在其之后通常也不单独设置激活函数。
下面我们来看一个完整卷积神经网络的传播过程。
2. 卷积神经网络的反向传播
现在,我们先看一个加入了池化层的完整卷积网络,补充一些细节:
另外一点要强调的是,和全连接网络相通,就是
尽量让激活数(每次应用激活函数的元素数量)保持较平稳的下降趋势。
避免出现”50000→1“这种断崖式下降。
现在我们就来看看这个网络的完整传播过程。
很显然,列举出传播过程后,问题紧接着就来了:
当梯度到达卷积层的时候,我们是如何根据不确定数量的像素梯度更新确定数量的卷积核的呢?
我们详细展开一下标红部分:
了解了逆展平和池化层传递参数后,就来到了最关键的部分:
卷积核和偏置如何根据有空间结构的梯度更新?
继续向下。
没错,
因为输出特征图中的每一个像素都是由卷积核与输入图像的区域运算后再加上偏置得到的,那么就代表反向传播计算得到输出中每一个像素的梯度都和 9 个卷积核参数与 1个偏置常量相关。
知道了这个,如何更新就已经呼之欲出了:
不写复杂的公式,用一句话来概括就是:
某个参数的最终梯度 = 它对所有受影响的输出像素的偏导数之和。
如果你忘了偏导和梯度的概念,他们第一次出现在这里:梯度下降法
这就是卷积层的反向传播过程,继续反向传播也是同样的道理。
最后,我们总结一下卷积层本身。
3.卷积层的特点
这一点的内容就更偏向理论了,相比全连接层,卷积层有两个突出的特点,我们称之为
参数共享和稀疏连接。
来简单介绍一下,不涉及太多具体应用,就不详细展开了。
参数共享: 不同于全连接层对每个输入特征有单独的权重,卷积层的输入图像共享卷积核和偏置参数。
原因是卷积核的适用性,我们可以用边缘检测卷积核检测左上角的竖直边缘,也可以用同样的卷积核检测右下角的竖直边缘。
稀疏连接: 不同于全连接层的输出和每个输入都有关,卷积层输出特征图中的每个像素只和产生他的几个像素有关。
原因是图像的局部性,要找猫耳朵,只要看耳朵那一块就行了。
4. 总结
概念 原理 比喻
池化层(最大池化、平均池化)
通过窗口取最大值或平均值,减少特征图空间尺寸,降低计算量,同时保留关键特征;无参与训练的参数。
“把照片压缩成缩略图”:不用每个像素都看清,只保留轮廓和显著信息。
池化层的尺寸计算
与卷积相同使用 \(\left\lfloor \frac{n - f + 2p}{s} \right\rfloor + 1\);通道数保持不变。
“裁剪图片”:窗口大小、步幅决定裁剪后的尺寸。
卷积层反向传播
输出每个像素的梯度都会对应卷积核全部参数;卷积核梯度是所有相关输出像素偏导的总和;偏置梯度是所有输出像素梯度的求和。
“每个菜被客人打了几分,后厨每个厨师要根据这些评分回溯自己哪一步影响了结果。”
参数共享
同一个卷积核扫描整个图像,因此所有位置使用同一组权重;大大减少参数量。
“同一个模具印图案”:不论纸放哪里,模具都是同一个。
稀疏连接
卷积核只与局部区域相乘,一个输出像素只依赖输入的一小块,而非整张图。
“你只需要看猫脸附近就能判断有没有耳朵,而不是看整张照片。”
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
卷积
基础知识
池化
操作
中的
相关帖子
rllm中的推理流程
SQL中的CTE用法初步(Common Table Expression公共表表达式)
Java+Playwright自动化测试-27- 操作单选和多选按钮
Flask数据库操作进阶:告别裸写SQL,用ORM提升开发效率
Flask数据库操作三步曲:连接、建模与CRUD实战
吴恩达深度学习课程四:计算机视觉 第一周:卷积基础知识(二)卷积参数
UEFI 中的杂项知识总结-Protocol Handle 机制的详细介绍
【人工智能时代】-带你秒懂Dify中的Chatflow和Workflow
吴恩达深度学习课程四:计算机视觉 第一周:卷积基础知识(三)简单卷积网络
轻量化网络中的知识蒸馏技术
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
rllm中的推理流程
0
133
轨项尺
2025-12-02
业界
SQL中的CTE用法初步(Common Table Expression公共表表达式)
1
624
尸酒岐
2025-12-05
业界
Java+Playwright自动化测试-27- 操作单选和多选按钮
1
20
沦嘻亟
2025-12-07
业界
Flask数据库操作进阶:告别裸写SQL,用ORM提升开发效率
0
1007
滤冽
2025-12-09
安全
Flask数据库操作三步曲:连接、建模与CRUD实战
0
703
判涔
2025-12-09
业界
吴恩达深度学习课程四:计算机视觉 第一周:卷积基础知识(二)卷积参数
0
897
钱闲华
2025-12-09
业界
UEFI 中的杂项知识总结-Protocol Handle 机制的详细介绍
0
149
嗅叽
2025-12-10
业界
【人工智能时代】-带你秒懂Dify中的Chatflow和Workflow
0
311
账暴
2025-12-10
业界
吴恩达深度学习课程四:计算机视觉 第一周:卷积基础知识(三)简单卷积网络
0
12
请蒂
2025-12-10
科技
轻量化网络中的知识蒸馏技术
1
249
全阳霁
2025-12-11
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
闰咄阅
昨天 19:26
关注
0
粉丝关注
22
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994893
kk14977
6845356
3934307807
991122
4
xiangqian
638210
5
宋子
9984
6
韶又彤
9999
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多