深度学习卷积神经网络CNN之 VGGNet模型主vgg16和vgg19网络模型详解说明(理论篇)

1.VGG背景
2. VGGNet模型结构
3. 特点(创新、优缺点及新知识点)

一、VGG背景

在这里插入图片描述

   VGGNet是2014年ILSVRC(ImageNet Large Scale Visual Recognition Challenge大规模视觉识别挑战赛)竞赛的第二名,解决ImageNet中的1000类图像分类和定位问题,第一名是GoogLeNet。

   VGG全称是Visual Geometry Group,因为是由Oxford的Visual Geometry Group提出的。AlexNet问世之后,很多学者通过改进AlexNet的网络结构来提高自己的准确率,主要有两个方向:小卷积核和多尺度。而VGG的作者们则选择了另外一个方向,即加深网络深度。主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能。

在这里插入图片描述

  他们以 7.32% 的错误率赢得了 2014 年 ILSVRC 分类任务的亚军(冠军由 GoogLeNet 以 6.65% 的错误率夺得)和 25.32% 的错误率夺得定位任务(Localization)的第一名(GoogLeNet 错误率为 26.44%)。VGG可以看成是加深版本的AlexNet. 都是conv layer + FC layer。

补充:

  ImageNet Large Scale Visual Recognition Challenge 是李飞飞等人于2010年创办的图像识别挑战赛,自2010起连续举办8年,极大地推动计算机视觉发展。比赛项目涵盖:图像分类(Classification)、目标定位(Object localization)、目标检测(Object detection)、视频目标检测(Object detection from video)、场景分类(Scene classification)、场景解析(Scene parsing)。竞赛中脱颖而出大量经典模型: alexnet,vgg,googlenet,resnet,densenet等。

二、VGGNet模型结构

1.相关论文

论文全名:Very deep convolutional networks for large-scale image recognition

论文下载地址https://arxiv.org/pdf/1409.1556.pdf

  VGG有两种结构,分别是VGG16和VGG19,两者并没有本质上的区别,只是网络深度不一样。在此过程中,作者做了六组实验,对应6个不同的网络模型,这六个网络深度逐渐递增的同时,也有各自的特点。实验表明最后两组,即深度最深的两组16和19层的VGGNet网络模型在分类和定位任务上的效果最好。

2.各组的区别:

A:起始。
A-LRN:加了LRN,这是AlexNet里提出来的。
B:加了两个卷积层。
C: 进一步叠加了3个卷积层,但是加的是1 * 1的kernel。
D:将C中1 * 1的卷积核替换成了3 * 3的,即VGG16。
E:在D的基础上进一步叠加了3个3*3卷积层,即VGG19。

在这里插入图片描述

VGG16包含了16个隐藏层(13个卷积层和3个全连接层),如上图中的D列所示。
VGG19包含了19个隐藏层(16个卷积层和3个全连接层),如上图中的E列所示。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  所有卷积层有相同的配置,即卷积核大小为3x3,步长为1,填充为1;共有5个最大池化层,大小都为2x2,步长为2;共有三个全连接层,前两层都有4096通道,第三层共1000路及代表1000个标签类别;最后一层为softmax层;所有隐藏层后都带有ReLU非线性激活函数;

三、特点(创新及新知识点)

  作者就用验证集当做测试集来观察模型性能。这里作者使用两种方式来评估模型在测试集(实际的验证集)的性能表现。LRN层无性能增益(A和A-LRN)、深度增加,分类性能提高(A、B、C、D、E)、conv1x1的非线性变化有作用(C和D)、多小卷积核比单大卷积核性能好(B)

  对于给定的感受野(与输出有关的输入图片的局部大小),采用堆积的小卷积核是优于采用大的卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式,而且代价还比较小(参数更少)。
简单来说,在VGG中,使用了3个3x3卷积核来代替7x7卷积核,使用了2个3x3卷积核来代替5*5卷积核,这样做的主要目的是在保证具有相同感知野的条件下,提升了网络的深度,在一定程度上提升了神经网络的效果。

  VGG16相比AlexNet的一个改进是,采用连续的几个3x3的卷积核(步长=1,padding=0),代替AlexNet中的较大卷积核(11x11,7x7,5x5)。

2、小池化核

  相比AlexNet的3x3的池化核,VGG全部为2x2的池化核;

3、层数更深、特征图更宽

  把网络层数加到了16、19层(不包括池化层和softmax层),而AlexNet是8层结构。基于前两点外,由于卷积核专注于扩大通道数、池化核专注于缩小宽和高,使得模型架构上更深更宽的同时,计算量的增加放缓。使网络有更大感受野的同时能降低网络参数,同时多次使用ReLu激活函数有更多的线性变换,学习能力更强。训练时将同一张图片缩放到不同的尺寸,在随机剪裁到224224的大小,能够增加数据量。预测时将同一张图片缩放到不同尺寸做预测,最后取平均值。网络测试阶段,全连接换成卷积。网络测试阶段,将训练阶段的3个全连接替换为3个卷积,测试重新用训练时的参数,使得测试得到的全卷积网络因为没有全连接的限制,因而可以接收任意宽或高为的输入。数据增强:方法一:针对位置 训练阶段:按比例缩放图片至最小边为S,随机位置裁剪出224224区域,随机进行水平翻转。方法二:针对颜色 修改RGB通道的像素值,实现颜色扰动,S设置方法:固定值:固定为256,或384,随机值:每个batch的S在[256, 512],实现尺度扰动。

4、VGG优点

VGGNet的结构非常简洁,整个网络都使用了同样大小的卷积核尺寸(3x3)和最大池化尺寸(2x2)。几个小滤波器(3x3)卷积层的组合比一个大滤波器(5x5或7x7)卷积层好:验证了通过不断加深网络结构可以提升性能。

5、VGG缺点
VGG耗费更多计算资源,并且使用了更多的参数(这里不是3x3卷积的锅),导致更多的内存占用(140M)。其中绝大多数的参数都是来自于第一个全连接层。VGG可是有3个全连接层啊!

参考文章 https://www.sohu.com/a/214925396_633698

经典CNN模型(三):VGG(PyTorch详细注释版)
qq_51872445的博客
07-24 1685
我们常用的是 D 配置,即 VGG-16,如上图,VGG-16 的 “16” 来源于网络中含有的 16 个有可学习权重的层,其中包括 13 个卷积层和 3 个全连接层。所有的卷积层都使用 3x3 大小的卷积核,所有的池化层都使用 2x2 的窗口和步幅为 2,这样可以将特征图的尺寸减半。
计算机视觉+深度学习技术+经典网络模型+图像处理和识别 在计算机视觉领域,经典深度学习网络CNN、ResNet、VGG等,使
03-21
计算机视觉是深度学习技术应用最为广泛和成熟的领域之一,它利用经典网络模型CNN卷积神经网络)、ResNet(残差网络)、VGG(Visual Geometry Group Network)等,来实现图像的处理和识别任务。这些网络模型通过深层的结构设计,能够有效地从原始图像数据中提取复杂的特征,进而用于图像的分类、识别、检测和分割等多种视觉任务。 CNN作为深度学习领域的基石之一,通过卷积层、池化层和全连接层的堆叠构建,有效地捕获了图像的局部特征和全局特征。VGG网络则通过重复堆叠相同大小的小卷积核,增加网络深度来提升性能,它在多个图像处理比赛中取得了优异的成绩。而ResNet通过引入残差学习的概念,解决了深层网络训练难的问题,使得网络能够通过增加层数来持续提高其性能。 这些经典网络模型在图像处理和识别领域的应用十分广泛。例如,在自动驾驶系统中,通过深度学习技术进行车辆和行人的识别,能够为驾驶系统提供精确的环境信息,保证行车安全。在医疗影像分析领域,深度学习网络能够帮助医生进行更准确的诊断,如通过图像识别技术检测癌细胞等。此外,深度学习技术还被广泛应用于安防监控、智能零售、面部识
大话CNN经典模型VGGNet
雪饼的博客
03-14 6315
摘要: 本文要介绍卷积神经网络CNN)的经典模型VGGNet的特点和网络结构,包括VGG16VGG19等—— 原文发布于本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),欢迎关注。  2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员一起研发出了新的深度卷积神经网络VGGNet,并取得了ILSVR...
1、VGG16 2、VGG19 3、ResNet50 4、Inception V3 5、Xception介绍——迁移学习
djph26741的博客
04-29 776
ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构 本文翻译自ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks,原作者保留版权 卷积神经网络在视觉识别任务上的表现令人称奇。好的CNN网络是带有上百万参数和许...
一文读懂最近流行的CNN架构(附学习资料)
数据派THU
01-14 3507
来源: 机器学习算法全栈工程师本文长度为4259字,建议阅读6分钟本文为你介绍CNN架构,包括ResNet, AlexNet, VGG, Inception。本文翻译自ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks,原作者保留版权。http://cv-tri
VGG16 & VGG19复现代码与权重
04-05
复现VGG16VGG19,其中VGG16VGG19权重放了连接,可自行下载。链接https://blog.csdn.net/jainszhang/article/details/79810478
VGG16VGG19
冰雪棋书的博客
01-18 4570
VGG16只能识别48*48大小的图像
VGG16VGG19介绍
南木的博客
03-15 4892
VGG16VGG19介绍 转载自:https://www.jianshu.com/p/e0845ecaf7f7 image.png 《Very Deep Convolutional Networks for Large-Scale Image Recognition》 arXiv:[1409.1556] Very Deep Convolutional Networks for Large-Scale ...
[人工智能-深度学习-34]:卷积神经网络CNN - 常见分类网络- VGG16/VGG19网络结构分析与详解
文火冰糖(王文兵)的博客
10-21 1万+
作者页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址: 第1章 卷积神经网络基础 1.1 卷积神经发展与进化史 AlexNet是深度学习的起点,后续各种深度学习网络或算法,都是源于AlexNet网络。 [人工智能-深度学习-31]:卷积神经网络CNN - 常见卷积神经网络综合比较大全_文火冰糖(王文兵)的博客-CSDN博客作者页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客本文网址:第1章 人工智.
用于大规模图像识别的深度卷积网络VGG16VGG19
weixin_42610407的博客
02-16 5433
2015 VGG16-PDF 参考: 1.深度学习、图像分类入门、从VGG16卷积神经网络开始 2.详解VGG16以及启发
vgg19vgg16百度云链接-附件资源
03-05
vgg19vgg16百度云链接-附件资源
vgg19.h5+vgg16.h5
09-03
在Gan生成对抗网络中,VGG16VGG19的".H5"模型文件,文件模组中两个。
动手学DL|Task5 LeNet+卷积神经网络进阶+循环神经网络进阶
01-20
卷积神经网络CNN)是深度学习领域中的关键模型,起源于Yann LeCun等人在1998年提出的LeNet-5架构。LeNet-5是最早期的卷积神经网络之一,对现代深度学习的发展产生了深远的影响。LeNet-5的要目标是解决图像分类...
深度学习》之 VGG卷积神经网络 原理 详解
DFCED的博客
03-20 7265
VGG卷积神经网络 一.背景 ILSVRC 2014的第二名是Karen Simonyan和 Andrew Zisserman实现的卷积神经网络,现在称其为VGGNet。它要的贡献是展示出网络的深度是算法优良性能的关键部分。 他们最好的网络包含了16个卷积/全连接层。网络的结构非常一致,从头到尾全部使用的是3x3的卷积和2x2的汇聚。他们的预训练模型是可以在网络上获得并在Caffe中使用的。 V...
深度学习经典网络(2)VGG网络结构详解
青衫憶笙
07-11 6619
0.介绍 深度神经网络一般由卷积部分和全连接部分构成。卷积部分一般包含卷积(可以有多个不同尺寸的核级联组成)、池化、Dropout等,其中Dropout层必须放在池化之后。全连接部分一般最多包含2到3个全连接,最后通过Softmax得到分类结果,由于全连接层参数量大,现在倾向于尽可能的少用或者不用全连接层。神经网络的发展趋势是考虑使用更小的过滤器,如1*1,3*3等;网络的深度更深(2012年A...
【人工智能】图文详解深度学习中的卷积神经网络CNN
热门推荐
程序员光剑
04-05 2万+
卷积神经网络是一种常用的深度学习模型,广泛用于图像识别、语音识别、自然语言处理等领域。它的核心思想是通过一系列卷积、池化等操作,提取出输入数据的特征,并通过全连接层等操作进行分类或回归等任务。
VGG19中的参数
qq_42120059的博客
03-30 266
最后一个[0]:相当于:array 数组:weight[0]=weight weight[1]=bias。[weight、pad、type、name、stride]:信息可以通过 0-4获取。[0][0][0]:连续三个0可以压缩去除虚的维。第一个[0]:压缩去除虚的维。[0-42]:层索引。
深度学习之基于Vgg19预训练卷积神经网络图像风格迁移系统
最新发布
Q1744828575的博客
05-06 812
一、项目背景在数字艺术和图像处理领域,图像风格迁移技术一直备受关注。该技术可以将一幅图像的内容和另一幅图像的风格相结合,生成全新的、具有独特艺术效果的图像。近年来,随着深度学习技术的快速发展,尤其是卷积神经网络CNN)在图像识别和处理领域的成功应用,基于深度学习的图像风格迁移技术取得了显著进步。本项目旨在利用VGG19预训练卷积神经网络开发一个高效的图像风格迁移系统。二、项目目标。
vgg19卷积神经网络模型结构
04-25
VGG19 卷积神经网络模型是一种由 Simonyan 和 Zisserman 提出的深度卷积神经网络模型。它的结构非常简单,由多个卷积层和池化层组成,最后是几个全连接层。 VGG19 模型由 5 个卷积块组成,每个卷积块包含 2 个卷积层,在每个卷积块之间都有一个池化层。每个卷积层包含 64 个 3x3 的卷积核,所以每个卷积层的输出通道数是 64。VGG19 的最后一个卷积块后是一个全局平均池化层,然后是 3 个全连接层。第一个全连接层包含 4096 个节点,第二个全连接层包含 4096 个节点,最后一个全连接层包含 1000 个节点,因为 VGG19 模型是用来进行 ImageNet 图像分类任务的,所以最后一个全连接层输出的是 1000 个类别的概率分布。
写文章

热门文章

  • MATLAB形态学的基本运算膨胀和腐蚀(开、闭运算) 27278
  • 1.Matlab图像的读取和显示 25664
  • 基于C/C++语言的停车场管理系统编程课程设计超详细 24956
  • 2.matlab图像三种方法灰度值处理 19903
  • 单片机AT89C51数码管数字时钟和闹钟二 17447

分类专栏

  • Python自学开始(理论+实战练习) 15篇
  • 图像分类、目标检测、语义分割理论 12篇
  • 机器学习理论 5篇
  • MATLAB图像处理 15篇
  • 51单片机 25篇
  • 数字建模竞赛 8篇
  • 一起动手学C/C++编程 3篇
  • Pytorch深度学习实战练习 6篇
  • MATLAB深度学习 2篇
  • MATLAB机器学习 4篇
  • python机器学习
  • C/C++课程项目设计编写 10篇
  • linux服务器 9篇
  • anaconda、pytorch框架包安装、相关代码解释 17篇
  • 学习 4篇
  • 数据挖掘算法 1篇

最新评论

  • 2004-2023年中国研究生数学建模竞赛历年试题整理

    DKbb13: 请问真题如何获取

  • matlab灰色图像和彩色图像的均值、标准差和熵

    m0_74099699: 彩色图像熵怎么算啊

  • 度学习pytorch实战六:ResNet50网络图像分类篇自建花数据集图像分类(5类)超详细代码

    m0_55851624: 谢谢

  • 2004-2023年中国研究生数学建模竞赛历年试题整理

    脑壳要想事: 怎么下载真题呀?

  • Matlab深度学习实战二:AlexNet图像分类篇提供花分类这里以分二类演示且matlab提供模型框架详细操作流程

    printf,scanf: 把第二层删掉重新加入就行了

大家在看

  • c++:类和对象(中)
  • C语言-rewind函数 1201
  • AgentTuning:提升大型语言模型的通用Agent能力 1046
  • 【春秋招必看】Unity相关笔试面试题(内有完整答案)第三期
  • 【Linux 20】线程控制 1505

最新文章

  • 4.第四章:程序的描述方式和程序代码流程的结构
  • python实战二:根据父母身高预测儿子的身高。
  • python实战一:从键盘获取一个4位整数,分别输出个位、十位、百位、千位上的数字。
2024年15篇
2023年40篇
2022年79篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

天下网标王溧阳市优化网站推广报价学习网站seo优化西安网站seo优化评比沿河网站关键词优化公司光谷网站优化的方法深圳专门做网站优化需要多少钱网站外链优化过度安阳网站优化公司价格.cx网站可以优化吗网站建设网站排名推广优化公司宣城网站排名优化哪家有实力百度网站优化公司化工网站seo优化服务包头seo网站优化公司优化网站版面和栏目设计企业网站如何优化降权网站图片比较多如何优化上海优化网站方法禹州智能网站优化需要多少钱网站产品优化方案东莞网站的优化绥化seo网站优化临汾网站优化五华区网站seo优化怎样网站长尾词优化有必要做吗河源专业网站优化多少钱网站优化中公司网站怎样优化网站网络优化方案ppt网站转化率优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化