卷积神经网络

卷积神经网络(CNN)是一种深度学习算法,特别擅长处理图像和视频数据。它通过模拟生物视觉系统的方式,利用卷积层、池化层等多层网络结构自动提取图像中的特征,进行分类、识别和预测。CNN被广泛应用于计算机视觉任务,如图像分类、人脸识别、物体检测等,已成为深度学习领域的重要模型之一。

卷积神经网络(CNN)——从图像分类到图像分割

从图像分类到图像分割

卷积神经网络(CNN)自2012年以来,在图像分类和图像检测等方面取得了巨大的成就和广泛的应用。

CNN的强大之处在于它的多层结构能自动学习特征,并且可以学习到多个层次的特征:较浅的卷积层感知域较小,学习到一些局部区域的特征;较深的卷积层具有较大的感知域,能够学习到更加抽象一些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低,从而有助于识别性能的提高。

这些抽象的特征对分类很有帮助,可以很好地判断出一幅图像中包含什么类别的物体,但是因为丢失了一些物体的细节,不能很好地给出物体的具体轮廓、指出每个像素具体属于哪个物体,因此做到精确的分割就很有难度。

传统的基于CNN的分割方法的做法通常是:为了对一个像素分类,使用该像素周围的一个图像块作为CNN的输入用于训练和预测。

用卷积神经网络来评估图形感知能力

卷积神经网络(Convolution Neural Network,CNN)已经在许多计算机视觉(Computer Vision)任务上取得了成功。 对于可视化,CNN 可以怎么应用于图形感知任务? 这篇文章 [1] 通过复制 Cleveland 和 McGill 的1984年的开创性实验 [2] 来研究这个问题,该实验测量了不同视觉编码的人类感知效率,并定义了可视化的基本感知任务。 我们在五种不同的可视化任务上测量了四种网络架构的图形感知功能,并与现有人的感知能力进行比较。 虽然在有限的情况下 CNN 能够达到或超越人工任务表现,但我们发现 CNN 目前还不是人类图形感知的良好模型。 我们提供这些实验的结果,以促进理解 CNN 在应用于数据可视化时的成功和失败。

这篇文章为了确定CNN模型来拟合人类对图形的感知能力,文章中主要用了四种模型来进行实验:多层感知机、LeNet、VGG19、Xception。

下面是具体的模型结构:

3 个经典的卷积神经网络案例分析

作者:魏秀参

本文将以 Alex-Net、VGG-Nets、Network-In-Network 为例,分析几类经典的卷积神经网络案例。

在此请读者注意,此处的分析比较并不是不同网络模型精度的“较量”,而是希望读者体会卷积神经网络自始至今的发展脉络和趋势。

这样会更有利于对卷积神经网络的理解,进而举一反三,提高解决真实问题的能力。

01:Alex-Net 网络模型

Alex-Net 是计算机视觉领域中首个被广泛关注并使用的卷积神经网络,特别是 Alex-Net 在 2012 年 ImageNet 竞赛 中以超越第二名 10.9个百分点的优异成绩一举夺冠,从而打响了卷积神经网络乃至深度学习在计算机视觉领域中研究热潮的“第一枪”。

Alex-Net 由加拿大多伦多大学的 Alex Krizhevsky、Ilya Sutskever(G. E. Hinton 的两位博士生)和 Geoffrey E. Hinton 提出,网络名“Alex-Net”即 取自第一作者名。

关于 Alex-Net 还有一则八卦:由于 Alex-Net 划时代的意义,并由此开启了深度学习在工业界的应用。

基于深度卷积神经网络和跳跃连接的图像去噪和超分辨

Image Restoration Using Very Deep Convolutional Encoder-Decoder Networks with Symmetric Skip Connections

作者:Xiao-Jiao Mao、Chunhua Shen等

本文提出了一个深度的全卷积编码-解码框架来解决去噪和超分辨之类的图像修复问题。网络由多层的卷积和反卷积组成,学习一个从受损图像到原始图像的端到端的映射。卷积层负责特征提取,捕获图像内容的抽象信息,同时消除噪声/损失。相对应,反卷积层用来恢复图像细节。

网络结构

基于深度卷积神经网络和跳跃连接的图像去噪和超分辨

在底层图像修复领域,由于池化操作会丢失有用的图像细节信息,因此,本网络没有用到池化层,是一个全卷积的网络结构。

卷积层的特征图和与之相应成镜像关系的反卷积层特征图进行跳跃连接,对应像素直接相加后经过非线性激活层然后传入下一层。