卷积神经网络（CNN卷积神经网络结构有哪些特点）

本文目录

CNN卷积神经网络结构有哪些特点
CNN（卷积神经网络）是什么
前馈神经网络、BP神经网络、卷积神经网络的区别与联系
类脑和卷积神经网络什么关系
卷积神经网络主要做什么用的
卷积神经网络工作原理直观的解释
什么是卷积神经网络为什么它们很重要
卷积神经网络有哪些改进的地方
如何更好的理解分析深度卷积神经网络
基于深度卷积神经网络进行人脸识别的原理是什么

CNN卷积神经网络结构有哪些特点

局部连接，权值共享，池化操作，多层次结构。
　　1、局部连接使网络可以提取数据的局部特征；
　　2、权值共享大大降低了网络的训练难度，一个Filter只提取一个特征，在整个图片(或者语音/文本) 中进行卷积；
　　3、池化操作与多层次结构一起，实现了数据的降维，将低层次的局部特征组合成为较高层次的特征，从而对整个图片进行表示。

在数字图像处理的时候我们用卷积来滤波是因为我们用的卷积模版在频域上确实是高通低通带通等等物理意义上的滤波器。然而在神经网络中，模版的参数是训练出来的，我认为是纯数学意义的东西，很难理解为在频域上还有什么意义，所以我不认为神经网络里的卷积有滤波的作用。接着谈一下个人的理解。首先不管是不是卷积神经网络，只要是神经网络，本质上就是在用一层层简单的函数（不管是sigmoid还是Relu）来拟合一个极其复杂的函数，而拟合的过程就是通过一次次back propagation来调参从而使代价函数最小。

前馈神经网络、BP神经网络、卷积神经网络的区别与联系

一、计算方法不同

1、前馈神经网络：一种最简单的神经网络，各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出，并输出给下一层．各层间没有反馈。

2、BP神经网络：是一种按照误差逆向传播算法训练的多层前馈神经网络。

3、卷积神经网络：包含卷积计算且具有深度结构的前馈神经网络。

二、用途不同

1、前馈神经网络：主要应用包括感知器网络、BP网络和RBF网络。

2、BP神经网络：

（1）函数逼近：用输入向量和相应的输出向量训练一个网络逼近一个函数；

（2）模式识别：用一个待定的输出向量将它与输入向量联系起来；

（3）分类：把输入向量所定义的合适方式进行分类；

（4）数据压缩：减少输出向量维数以便于传输或存储。

3、卷积神经网络：可应用于图像识别、物体识别等计算机视觉、自然语言处理、物理学和遥感科学等领域。

联系：

BP神经网络和卷积神经网络都属于前馈神经网络，三者都属于人工神经网络。因此，三者原理和结构相同。

三、作用不同

1、前馈神经网络：结构简单，应用广泛，能够以任意精度逼近任意连续函数及平方可积函数．而且可以精确实现任意有限训练样本集。

2、BP神经网络：具有很强的非线性映射能力和柔性的网络结构。网络的中间层数、各层的神经元个数可根据具体情况任意设定，并且随着结构的差异其性能也有所不同。

3、卷积神经网络：具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类。

扩展资料：

1、BP神经网络优劣势

BP神经网络无论在网络理论还是在性能方面已比较成熟。其突出优点就是具有很强的非线性映射能力和柔性的网络结构。网络的中间层数、各层的神经元个数可根据具体情况任意设定，并且随着结构的差异其性能也有所不同。但是BP神经网络也存在以下的一些主要缺陷。-卷积神经网络

①学习速度慢，即使是一个简单的问题，一般也需要几百次甚至上千次的学习才能收敛。

②容易陷入局部极小值。

③网络层数、神经元个数的选择没有相应的理论指导。

④网络推广能力有限。

2、人工神经网络的特点和优越性，主要表现在以下三个方面

①具有自学习功能。例如实现图像识别时，只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络，网络就会通过自学习功能，慢慢学会识别类似的图像。自学习功能对于预测有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、效益预测，其应用前途是很远大的。-卷积神经网络

②具有联想存储功能。用人工神经网络的反馈网络就可以实现这种联想。

③具有高速寻找优化解的能力。寻找一个复杂问题的优化解，往往需要很大的计算量，利用一个针对某问题而设计的反馈型人工神经网络，发挥计算机的高速运算能力，可能很快找到优化解。

参考资料：百度百科—前馈神经网络

百度百科—BP神经网络

百度百科—卷积神经网络

百度百科—人工神经网络

类脑和卷积神经网络什么关系

一、“类脑”概念

1. 在早期，类脑一般是指从软硬件上模拟生物神经系统的结构与信息加工方式。

随着软硬件技术的进步，以及神经科学与各种工程技术的多方面融合发展，脑与机的界限被逐步打破。尤其是脑机接口，在计算机与生物脑之间建立了一条直接交流的信息通道，这为实现脑与机的双向交互、协同工作及一体化奠定了基础。-卷积神经网络

随之，“类脑”的概念逐步从信息域自然地延伸到生命域。因此，以脑机互联这一独特方式实现计算或智能，也被归入“类脑研究”范畴。

2. 类脑研究是以“人造超级大脑”为目标，借鉴人脑的信息处理方式，模拟大脑神经系统，构建以数值计算为基础的虚拟超级脑；或通过脑机交互，将计算与生命体融合，构建以虚拟脑与生物脑为物质基础的脑机一体化的超级大脑，最终建立新型的计算结构与智能形态。我们不妨将类脑的英文称为Cybrain (Cybernetic Brain)，即仿脑及融脑之意。其主要特征包括：-卷积神经网络

A.以信息为主要手段：用信息手段认识脑、模拟脑乃至融合脑；
B.以人造超级大脑为核心目标：包括以计算仿脑为主的虚拟超级脑，以及虚拟脑与生物脑一体化的超级大脑这两种形态；
C.以学科交叉会聚为突破方式：不单是计算机与神经科学交叉，还需要与微电子、材料、心理、物理、数学等大学科密切交叉会聚，才有更大机会取得突破。
3. 类脑研究的主要内容：
类脑研究要全面实现“懂脑、仿脑、连脑”，脑认知基础、类脑模拟、脑机互联三个方面缺一不可。因此，我们将类脑研究主要内容归纳为三个方面：信息手段认识脑、计算方式模拟脑、脑机融合增强脑（见图1）。其中，信息技术贯穿始终。-卷积神经网络

二、卷积神经网络

1. 卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络（Feedforward Neural Networks），是深度学习（deep learning）的代表算法之一。-卷积神经网络

2. 卷积神经网络具有表征学习（representation learning）能力，能够按其阶层结构对输入信息进行平移不变分类（shift-invariant classification），因此也被称为“平移不变人工神经网络（Shift-Invariant Artificial Neural Networks, SIANN）” 。-卷积神经网络

3. 对卷积神经网络的研究始于二十世纪80至90年代，时间延迟网络和LeNet-5是最早出现的卷积神经网络。

在二十一世纪后，随着深度学习理论的提出和数值计算设备的改进，卷积神经网络得到了快速发展，并被应用于计算机视觉、自然语言处理等领域。

4. 卷积神经网络仿造生物的视知觉（visual perception）机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化（grid-like topology）特征，例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程（feature engineering）要求。-卷积神经网络

三、二者关系

人工智能时代的到来，大数据可以提供给计算机对人脑的模拟训练，强大的算力可以支撑计算机能够充分利用大数据获得更多规律，进行知识的学习。

类脑智能做的面比较广，出发点是开发一个与人脑具有类似功能的模拟大脑出来，达到人类的智慧，深度学习只是其中的一个小小的分支，是对人脑研究的一个小成果，而类脑智能相对研究的比较宽泛和深入。

而卷积神经网络只是深度学习的代表算法之一。

卷积神经网络主要做什么用的

卷积网络的特点主要是卷积核参数共享，池化操作。
参数共享的话的话是因为像图片等结构化的数据在不同的区域可能会存在相同的特征，那么就可以把卷积核作为detector，每一层detect不同的特征，但是同层的核是在图片的不同地方找相同的特征。然后把底层的特征组合传给后层，再在后层对特征整合(一般深度网络是说不清楚后面的网络层得到了什么特征的)。
而池化主要是因为在某些任务中降采样并不会影响结果。所以可以大大减少参数量，另外，池化后在之前同样大小的区域就可以包含更多的信息了。
综上，所有有这种特征的数据都可以用卷积网络来处理。有卷积做视频的，有卷积做文本处理的(当然这两者由于是序列信号，天然更适合用lstm处理)
另外，卷积网络只是个工具，看你怎么使用它，有必要的话你可以随意组合池化和卷积的顺序，可以改变网络结构来达到自己所需目的的，不必太被既定框架束缚。
-卷积神经网络

卷积神经网络工作原理直观的解释

其实道理很简单，因为卷积运算，从频域角度看，是频谱相乘所以图像跟卷积核做卷积时，两者频谱不重叠的部分相乘，自然是0，那图像这部分频率的信息就被卷积核过滤了。而图像，本质上就是二维离散的信号，像素点值的大小代表该位置的振幅，所以图像包含了一系列频率的特征。比如图像边缘部分，像素值差别大，属于高频信号，背景部分，像素值差别小，是低频信号。所以如果卷积核具有『高通』性质，就能起到提取图像边缘的作用，低通则有模糊的效果。所以，卷积神经网络的牛逼之处在于通过卷积层的不同卷积核，提取图像不同频段的特征；以及通过池化层，提取不同粒度的特征。-卷积神经网络

什么是卷积神经网络为什么它们很重要

卷积神经网络（Convolutional Neural Network,CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。它包括卷积层(alternating convolutional layer)和池层(pooling layer)。-卷积神经网络
卷积神经网络是近年发展起来，并引起广泛重视的一种高效识别方法。20世纪60年代，Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络（Convolutional Neural Networks-简称CNN）。现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。 K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后，更多的科研工作者对该网络进行了改进。其中，具有代表性的研究成果是Alexander和Taylor提出的“改进认知机”，该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。-卷积神经网络

卷积神经网络有哪些改进的地方

卷积神经网络的研究的最新进展引发了人们完善立体匹配重建热情。从概念看，基于学习算法能够捕获全局的语义信息，比如基于高光和反射的先验条件，便于得到更加稳健的匹配。目前已经探求一些两视图立体匹配，用神经网络替换手工设计的相似性度量或正则化方法。这些方法展现出更好的结果，并且逐步超过立体匹配领域的传统方法。事实上，立体匹配任务完全适合使用CNN，因为图像对是已经过修正过的，因此立体匹配问题转化为水平方向上逐像素的视差估计。
与双目立体匹配不同的是，MVS的输入是任意数目的视图，这是深度学习方法需要解决的一个棘手的问题。而且只有很少的工作意识到该问题，比如SurfaceNet事先重建彩色体素立方体，将所有像素的颜色信息和相机参数构成一个3D代价体，所构成的3D代价体即为网络的输入。然而受限于3D代价体巨大的内存消耗，SurfaceNet网络的规模很难增大：SurfaceNet运用了一个启发式的“分而治之”的策略，对于大规模重建场景则需要花费很长的时间。
-卷积神经网络

如何更好的理解分析深度卷积神经网络

用局部连接而不是全连接，同时权值共享。

局部连接的概念参考局部感受域，即某个视神经元仅考虑某一个小区域的视觉输入，因此相比普通神经网络的全连接层（下一层的某一个神经元需要与前一层的所有节点连接），卷积网络的某一个卷积层的所有节点只负责前层输入的某一个区域（比如某个3*3的方块）。这样一来需要训练的权值数相比全连接而言会大大减少，进而减小对样本空间大小的需求。-卷积神经网络

权值共享的概念就是，某一隐藏层的所有神经元共用一组权值。

这两个概念对应卷积层的话，恰好就是某个固定的卷积核。卷积核在图像上滑动时每处在一个位置分别对应一个“局部连接”的神经元，同时因为“权值共享”的缘故，这些神经元的参数一致，正好对应同一个卷积核。

顺便补充下，不同卷积核对应不同的特征，比如不同方向的边（edge）就会分别对应不同的卷积核。

激活函数f(x)用ReLU的话避免了x过大梯度趋于0（比如用sigmoid）而影响训练的权值的情况（即Gradient Vanishing）。同时结果会更稀疏一些。
池化之后（例如保留邻域内最大或采纳平均以舍弃一些信息）一定程度也压制了过拟合的情况。

综述

总体来说就是重复卷积-relu 来提取特征，进行池化之后再作更深层的特征提取，实质上深层卷积网络的主要作用在于特征提取。最后一层直接用softmax来分类（获得一个介于0~1的值表达输入属于这一类别的概率）。-卷积神经网络

基于深度卷积神经网络进行人脸识别的原理是什么

本质上是模式识别，把现实的东西抽象成计算机能够理解的数字。
如果一个图片是256色的，那么图像的每一个像素点，都是0到255中间的一个值，这样你可以把一个图像转换成一个矩阵。
如何去识别这个矩阵中的模式？用一个相对来讲很小的矩阵在这个大的矩阵中从左到右，从上到下扫一遍，每一个小矩阵区块内，你可以统计0到255每种颜色出现的次数，以此来表达这一个区块的特征。这样通过这一次“扫描”，你得到了另一个由很多小矩阵区块特征组成的矩阵。
这一个矩阵比原始的矩阵要小吧？那就对了！
然后对这个小一点的矩阵，再进行一次上面的步骤，进行一次特征“浓缩”，用另一个意思来讲，就是把它抽象化。
最后经过很多次的抽象化，你会将原始的矩阵变成一个 1 维乘 1 维的矩阵，这就是一个数字。
而不同的图片，比如一个猫，或者一个狗，一个熊，它们最后得到的这个数字会不同。于是你把一个猫，一个狗，一个熊都抽象成了一个数字，比如 0.34， 0.75， 0.23，这就达到让计算机来直接辨别的目的了。
人脸，表情，年龄，这些原理都是类似的，只是初始的样本数量会很大，最终都是通过矩阵将具体的图像抽象成了数字，因为计算机只认识数字。
但是抽象的函数，会有所不同，达到的效果也会不同。-卷积神经网络

电脑数码网

Nice to meet you, too!

卷积神经网络