入门计算机视觉,这7点可以让你少走点弯路

计算机视觉(Computer vision)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行仪器检测的图像。

近几年随着人脸识别在生活中的应用场景不断增加,计算机视觉开始渐渐走入大众视野,作为人工智能一个很重要的研究方向,有不少同学都想日后在这个领域带着前辈的成绩,做出相应的突破。

为了让同学们更好的去学习和研究计算机视觉,尤其是CV新手同学,班主任从学习方法和编程实践两个方面,总结了以下7点,希望能够对同学们有所启发。

01、掌握好相应的基础能力

计算机视觉的理念其实与很多概念有部分重叠,包括:人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。

所以在入门CV之前,同学们最好对基础的学术课程都有对应的了解,比如数学方面的微积分,概率学,统计学,线性代数这几门基础课程。

在编程语言方面,Matlab,Python,C++,最好熟悉其中2种,因为计算机视觉离开计算机编程是完全行不通的。

02、系统的学习下计算机视觉课程

对于CV新手来说,想要从小白到大神,最快的方法就是先系统的学习一下计算机视觉的课程,全面了解一下计算机视觉这个领域的背景及其发展、这个领域有哪些基本的问题、哪些问题的研究已经比较成熟了,哪些问题的研究还处于基础阶段。

在这里班主任推荐3本经典教材:

《Computer Vision: A Modern Approach》

《Computer Vision: Algorithms and Applications》

《Computer Vision: Models, Learning, and Inference》

这三本教材班主任认为是计算机视觉最好的入门教材了,内容丰富,难度适中,其中第二本书涉及大量的文献,很适合对计算机视觉没什么概念的同学。这三本教材都不建议读中文版,有些地方的翻译不是很合适。

03、 你需要一个专业工具

工欲善其事,必先利其器。对于想要学好计算机视觉的同学来说,一个专业的工具,绝对是助攻的不二神器。

OpenCV(开源计算机视觉库)是一个非常强大的学习资料库,包括了计算机视觉,模式识别,图像处理等许多基本算法。

它免费提供给学术和商业用途,有C++,C,Python和java接口,支持Windows、Linux、Mac OS、iOS和Android。

04、绕不开的数字图像处理

数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。

入门的同学推荐冈萨雷斯的《数字图像处理》《数字图像处理(第3版)(英文版)》和对应的Matlab版本。一本讲基础的理论,一本讲怎么用Matlab实现。

除此之外同学们还可以去YouTube上找到相关的课程信息,相信大家会有所收获的。

05、贯穿始终的模式识别

模式识别(Pattern Recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。

计算机视觉很多东西都是基于图像识别的,图像识别就是模式识别的一种。

模式识别通常是训练一个模型来拟合当前的数据,当我们拿到一堆数据或图片,需要从当中找到它们的关系,最便捷的便是用模式识别算法来训练一个模型。

班主任推荐一本模式识别入门级的教材《模式分类》,相对于《模式识别》这本书来说可能比较难,但书中介绍了很多模式识别经典的分类器,还是很值得一读。

06、深度学习与CNN

关于深度学习这几年讲的已经太多了,资料也非常多,班主任在这里就不在赘述啦,有兴趣的同学可以看看班主任之前给大家整理资料 福利 | 20本顶级人工智能教材免费送

计算机视觉里经常使卷积神经网络,即CNN,是一种对人脑比较精准的模拟。

什么是卷积?卷积就是两个函数之间的相互关系,然后得出一个新的值,他是在连续空间做积分计算,然后在离散空间内求和的过程。

同学们可以试着学习下CNN在计算机视觉当中的应用,推荐大家荐斯坦福的CS231n课程:深度学习与计算机视觉。

07、了解最新领域动态

很多同学做研究的时候,容易陷入自我封闭的“怪圈”,过于执着于埋头学习相关知识,有时候会忘记及时了解相关领域的最新动态,这是非常不科学的。

同学们在学习计算机视觉相关知识的时候,可以通过最新的paper来了解这个领域最新提出的一些概念以及发展的情况。

计算机视觉的期刊有两个PAMI和IJCV,顶级的学术会议有 CVPR、ICCV、 ECCV、 BMVC这四个,同学们可以跟着浏览这些期刊论文以及会议文章,相信一定可以学到不少有用的知识。

结语:做好计算机视觉研究并不是一件容易的事情,在大多数情况下它甚至是一件很枯燥的事情。

研究成果毫无进展,研究方向不在明朗等等,这一切都会给你前所未有的压力,班主任希望同学们在决定入这一行的时候,是出于自己的热爱,而不是出于当前的趋势。

因为热爱不会变,但趋势每一年都在变。

本文来源网络,转载此文目的在于传递更多信息,版权归原作者所有。

最新文章