登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
卷积基础知识(四)池化操作与卷积中的反向传播 ...
卷积基础知识(四)池化操作与卷积中的反向传播
[ 复制链接 ]
闰咄阅
2025-12-11 19:26:11
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
此分类用于记录吴恩达深度学习课程的学习笔记。
课程相关信息链接如下:
原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai
github课程资料,含课件与笔记:吴恩达深度学习教学资料
课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案
本篇为第四课的第一周内容,1.9到1.11的内容,同时也是本周理论部分的最后一篇。
本周为第四课的第一周内容,这一课所有内容的中心只有一个:
计算机视觉
。应用在深度学习里,就是专门用来进行图学习的模型和技术,是在之前全连接基础上的“特化”,也是相关专业里的一个重要研究大类。
这一整节课都存在大量需要反复理解的内容和机器学习、数学基础。
因此我会尽可能的补足基础,用比喻和实例来演示每个部分,从而帮助理解。
本篇的内容关于
池化操作与卷积中的反向传播
,是对本周内容的最后补完,本篇之后,我们就可以对卷积神经网络的基本组件与传播过程有一个较完整的认知。
1. 池化层(pooling layer)
除去卷积层和全连接层,池化层也是卷积神经网络的一大基石,不要被这个名字吓到,它的原理反而是最简单的。
常见的池化分为两种:
最大池化和平均池化。
使用方法并不难,我们直接摆出来:
最大池化:不计算,直接使用窗口最大值作为结果的卷积操作。
平均池化:用窗口所有像素的平均值作为结果的卷积操作。
先来看最大池化,我们通过课程里的例子补充一些细节:
现在我们知道了最大池化怎么用了,问题紧接着就来了,
这个操作是用来干嘛的?
我们继续:
你可能发现了一个 bug :
那万一重要特征反而是被一堆大像素包围的小像素呢?这样不是反而把最重要的特征扔了吗?
平均池化可以缓解这种现象:
实际上,
池化最大的作用就是在卷积神经网络中减少特征图的空间尺寸来降低计算复杂度,同时保留特征信息。
而对于怎么池化更好更合适,还是要在具体任务中不断尝试。
此外,
对于输出特征图的大小计算,卷积的输出公式在这里仍然适用:
\[\text{输出尺寸}=\left\lfloor\frac{n - f + 2p}{s}\right\rfloor + 1, 注:\lfloor向下取整\rfloor \]
而对于多通道的池化处理,也和卷积核的逻辑相同,确保和输入图像的通道数相等
。
最后强调一点:
你会发现,池化层只有人工设置的超参数,没有任何参与传播的参数,在其之后通常也不单独设置激活函数。
下面我们来看一个完整卷积神经网络的传播过程。
2. 卷积神经网络的反向传播
现在,我们先看一个加入了池化层的完整卷积网络,补充一些细节:
另外一点要强调的是,和全连接网络相通,就是
尽量让激活数(每次应用激活函数的元素数量)保持较平稳的下降趋势。
避免出现”50000→1“这种断崖式下降。
现在我们就来看看这个网络的完整传播过程。
很显然,列举出传播过程后,问题紧接着就来了:
当梯度到达卷积层的时候,我们是如何根据不确定数量的像素梯度更新确定数量的卷积核的呢?
我们详细展开一下标红部分:
了解了逆展平和池化层传递参数后,就来到了最关键的部分:
卷积核和偏置如何根据有空间结构的梯度更新?
继续向下。
没错,
因为输出特征图中的每一个像素都是由卷积核与输入图像的区域运算后再加上偏置得到的,那么就代表反向传播计算得到输出中每一个像素的梯度都和 9 个卷积核参数与 1个偏置常量相关。
知道了这个,如何更新就已经呼之欲出了:
不写复杂的公式,用一句话来概括就是:
某个参数的最终梯度 = 它对所有受影响的输出像素的偏导数之和。
如果你忘了偏导和梯度的概念,他们第一次出现在这里:梯度下降法
这就是卷积层的反向传播过程,继续反向传播也是同样的道理。
最后,我们总结一下卷积层本身。
3.卷积层的特点
这一点的内容就更偏向理论了,相比全连接层,卷积层有两个突出的特点,我们称之为
参数共享和稀疏连接。
来简单介绍一下,不涉及太多具体应用,就不详细展开了。
参数共享: 不同于全连接层对每个输入特征有单独的权重,卷积层的输入图像共享卷积核和偏置参数。
原因是卷积核的适用性,我们可以用边缘检测卷积核检测左上角的竖直边缘,也可以用同样的卷积核检测右下角的竖直边缘。
稀疏连接: 不同于全连接层的输出和每个输入都有关,卷积层输出特征图中的每个像素只和产生他的几个像素有关。
原因是图像的局部性,要找猫耳朵,只要看耳朵那一块就行了。
4. 总结
概念 原理 比喻
池化层(最大池化、平均池化)
通过窗口取最大值或平均值,减少特征图空间尺寸,降低计算量,同时保留关键特征;无参与训练的参数。
“把照片压缩成缩略图”:不用每个像素都看清,只保留轮廓和显著信息。
池化层的尺寸计算
与卷积相同使用 \(\left\lfloor \frac{n - f + 2p}{s} \right\rfloor + 1\);通道数保持不变。
“裁剪图片”:窗口大小、步幅决定裁剪后的尺寸。
卷积层反向传播
输出每个像素的梯度都会对应卷积核全部参数;卷积核梯度是所有相关输出像素偏导的总和;偏置梯度是所有输出像素梯度的求和。
“每个菜被客人打了几分,后厨每个厨师要根据这些评分回溯自己哪一步影响了结果。”
参数共享
同一个卷积核扫描整个图像,因此所有位置使用同一组权重;大大减少参数量。
“同一个模具印图案”:不论纸放哪里,模具都是同一个。
稀疏连接
卷积核只与局部区域相乘,一个输出像素只依赖输入的一小块,而非整张图。
“你只需要看猫脸附近就能判断有没有耳朵,而不是看整张照片。”
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
卷积
基础知识
池化
操作
中的
相关帖子
如何提升 C# 应用中的性能
如何提升 C# 应用中的性能
如何提升 C# 应用中的性能
Flink源码阅读:双流操作
深夜码字:把C#操作XML那点事,一次给你讲明白
StreamJsonRpc 在 HagiCode 中的深度集成与实践
BlockingQueue:阻塞操作与条件队列的高效结合
传说中的C++精灵库,专治“C++恐惧症”?
揭开 C#中的异步/等待:隐藏状态机
Java中的数据类型
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
如何提升 C# 应用中的性能
3
1015
慢秤
2026-01-21
业界
如何提升 C# 应用中的性能
3
184
齐娅晶
2026-01-21
业界
如何提升 C# 应用中的性能
8
506
嘀荼酴
2026-01-21
业界
Flink源码阅读:双流操作
1
8
笃迩讦
2026-01-27
安全
深夜码字:把C#操作XML那点事,一次给你讲明白
0
3
处匈跑
2026-01-28
业界
StreamJsonRpc 在 HagiCode 中的深度集成与实践
1
851
喝岖
2026-01-29
安全
BlockingQueue:阻塞操作与条件队列的高效结合
0
601
精滂软
2026-01-30
业界
传说中的C++精灵库,专治“C++恐惧症”?
0
390
靳谷雪
2026-02-01
业界
揭开 C#中的异步/等待:隐藏状态机
0
566
嗳歉楞
2026-02-02
安全
Java中的数据类型
0
816
赖娅闺
2026-02-02
回复
(10)
蔺堰
2025-12-20 05:23:06
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
百里宵月
2025-12-31 15:15:15
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
东西不错很实用谢谢分享
渭茱瀑
2026-1-7 03:30:28
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
晌集涟
2026-1-10 19:06:52
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享
缑莺韵
2026-1-13 18:36:33
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢,下载保存了
况雪柳
2026-1-14 10:54:13
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
丘娅楠
2026-1-17 14:02:13
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享,学习下。
硫辨姥
2026-1-23 07:04:24
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
很好很强大 我过来先占个楼 待编辑
康器
5 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
yyds。多谢分享
俞秋荣
3 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢分享,试用一下
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
科技
安全
程序
签约作者
程序园优秀签约作者
发帖
闰咄阅
3 天前
关注
0
粉丝关注
22
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
宋子
9939
6
韶又彤
9952
7
闰咄阅
9993
8
刎唇
9995
9
蓬森莉
9921
10
俞瑛瑶
9998
查看更多
今日好文热榜
506
OpenClaw架构解析:AI工程师的实战学习范本
638
AI Agent 框架探秘:拆解 OpenHands(5)--
873
一个昏暗的编程教室,电脑屏幕前坐着一位程
532
C++算法算法训练第十二天
912
语言开发随笔2
878
Ivanti EPMM RCE CVE-2026-1340/1281完整分
741
城市智能体:宜昌点军区算力供应链平台的区
250
微软发布Maia200,它也开始与英伟达谷歌掰
922
微软发布Maia200,它也开始与英伟达谷歌掰
470
选型指南】医用控温仪显示屏如何兼顾IEC606
457
IDEA 终于也能爽用 Claude Code 了!!
855
GIM 2.0 发布:真正让 AI 提交消息可定制、
172
C# 设置 Word 文档背景颜色/背景图
845
妙手ERP荣膺TikTok Shop 2025 H1“优质招商
162
题解:P15049 [UOI 2022 II Stage] 图 2
975
vue 甘特图 vxe-gantt 自定义任务条插槽模
240
Qt 技巧笔记(四)QVector 的底层原理与高
714
零门槛搭建部署 OpenClaw/Moltbot/Clawdbot
763
如何保障分布式IM聊天系统的消息可靠性(即
987
【面试题】MySQL 中 count(*)、count(1) 和