当前位置:网站首页>DenseNet学习笔记(核心与resnet进行对比):
DenseNet学习笔记(核心与resnet进行对比):
2022-07-20 03:12:00 【Wsyoneself】
- 概述:比resnet更优的cnn模型
- resnet:
- resnet可以训练出更深的cnn模型,实现更高的准确度,resnet模型的核心是通过建立前面层和后面层之间的“短路连接”,有助于训练过程中的反向传播,从而能训练出更深的cnn网络(可能主要是解决梯度消失问题)。
- resnet是每个层与前面的某层(一般还是2-3层)短路连接在一起,连接方式是通过元素级相加。
- densenet:
- 特色:在channel上的连接来实现特征重用。让densenet在参数和计算成本更少的情形下实现比resnet更优的性能。
- 连接机制:互相连接所有层,即每个层都接受其前面所有层作为其额外的输入。
- densenet中每个层和前面所有层在channel维度上连接,并且作为下一层的输入。
- densenet直接连接来自不同层的特征图,可以实现特征重用,提升效率
- cnn网络一般要经过pooling 或stride>1的卷积来降低特征图的大小,而densenet的密集连接方式需要特征图大小保持一致。所以densenet网络中使用denseblock+transition结构
- denseblock:
- 包含很多层的模块,每个层的特征图大小相同。层与层之间采用密集连接方式。denseblock中的非线性组合函数H(·)采用的是BN+Relu+3x3conv的结构。
- 所有denseblock中各个层卷积之后均输出k个特征图,即得到的特征图的channel数为k,或者说采用k个卷积核,k是一个超参数。一般情况下,使用较小的k(比如12),就可以得到较佳的性能。
- 由于后面层的输入会非常大,denseblock内部可以采用bottleneck层来减少计算量。具体实现:在原有结构中增加1X1conv
- transition模块:
- 是连接两个相邻的denseblock,并通过pooiling使特征图大小降低。
- 主要是连接两个相邻的denseblock,并降低特征图大小。包括一个1X1的卷积和2X2的平均池化。结构为BN+Relu+1X1conv+2X2 avgpooling,transition层可以起到压缩模型的作用。
- denseblock:
- densenet比resnet更优的本质:resnet是以sum方式合并特征,这样就不能反推出原来的输入特征,而concat可以,所以concat方式在保持特征或还原特征方面有优势。
- densenet缺点:很占用显存
- 一个训练过程中的一个小tip:特征提取都是nan:nan是梯度暴涨或梯度消失,可以增大batch_size
边栏推荐
- How to install scons low version
- 网站引用百度地图,乱码及无图标
- 乐扣乐扣澄清欠税事件:不存在欠税,将一如既往合规经营,植根中国
- Understanding and applying continuous integration Tekton
- [5gc] 5g PDU session and session type
- 技术干货 | 解决面试中80%问题,基于MindSpore实现AUC/ROC
- Use Amazon memorydb for redis as the metadata engine of juicefs
- . Net core rapid development platform, powerful workflow engine, multi system rapid configuration
- What do 1U, 2U and 4U of the server mean?
- [pygame Learning notes] 8. Elfe.
猜你喜欢
The third national finals of the University of Hong Kong Space China business school and enterprise research institute innovation and entrepreneurship competition came to a successful conclusion
RedHat 7 network service cannot start. The problem ("device does not see to be present, delaying initialization") is handled
技术干货 | MindSpore 自研高阶优化器源码分析和实践应用
(PC+WAP)织梦模板会计服务类网站
MySQL index
【5GC】5G PDU会话以及会话类型
Harbor 高可用集群设计及部署(离线安装方式、含视频)
MySQL 索引
Reinforcement Mechanism Design:With Applications to Dynamic Pricing in Sponsored Search Auction
【Pygame 學習筆記】8.精靈
随机推荐
V4l2 learning notes
vben-admin 时间选择器相关配置以及设置不可选择的时间
10 port scanning tools for advanced scanning by network administrators
高通和MTK针对国家wifi channel 客制化修改方法
LeetCode. 558. Intersection of quadtrees___ Divide and conquer
Necessary skills for mobile terminal test: ADB command and packet capturing
30-Spark入门之Spark技术栈讲解、分区、系统架构、算子和任务提交方式
服务器的1U、2U、4U是指什么?
[OBS] text description of QT UI
NetFlow and SNMP are two different network monitoring methods
四层、七层负载均衡的区别(转)
[trivia] about some unity editors, they lack the tiles option when creating tile maps
[LeetCode]剑指 Offer 58 - II. 左旋转字符串
归并排序针对性刷题
MindSpore开源周年狂欢,量子机器学习与深度分子模拟等巨量新特性来袭!
【R语言文本挖掘】:情感分析与词云图绘制
At32 uses the kernel DWT register to set the delay time
深入理解 MySQL 执行过程及执行顺序
. Net core rapid development platform, powerful workflow engine, multi system rapid configuration
[5gc] 5g PDU session and session type