深度解读计算机视觉技术
demi 在 周三, 04/17/2019 - 17:55 提交
从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。自然视觉能力,就是指生物视觉系统体现的视觉能力。一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。
从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。自然视觉能力,就是指生物视觉系统体现的视觉能力。一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。
计算机视觉的早期实验始于20世纪50年代,并在20世纪70年代首次在商业上用于区分打字文本和手写文本,但如今计算机视觉的应用已呈指数级增长。预计到2022年,计算机视觉和硬件市场预计将达到486亿美元。
计算机视觉(Computer vision)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行仪器检测的图像。
在概念层面,图像处理和计算机视觉之间存在很多重叠,并且经常被误解的术语可以互换使用。在这里,我们简要概述了这些技术,并解释了它们在基础层面上的不同之处。
计算机视觉的几大任务:图像识别;目标检测;图像分割;目标跟踪;多模态问题。
无人车视觉传感器:超声波雷达(倒车)、毫米波雷达、LiDAR与摄像头。激光雷达精度,速度高(厘米级),成本高;毫米波雷达可适应恶劣天气
搞了CV一段时间,仍时不时因为概念问题而困惑,搞不清楚计算机视觉(Computer Vision),计算机图形学(Computer Graphics)和图像处理(Image Processing)的区别和联系。在知乎上看到了一个帖子,觉得解释的很好,结合自己的理解,形成此文存档。
从图像中将某个特定区域与其他部分进行分离并提取出来的处理就是图像分割。因为图像分割处理实际上就是区分图像中的“前景目标”和“背景”,所以通常又称之为图像的二值化处理。图像分割在图像分析、图像识别、图像检测等方面占有非常重要的低位。
想做计算机视觉?深度学习是最近的发展方向。大规模数据集加上深度卷积神经网络(CNN)的表征能力使得超精确和稳健的模型成为可能。由于计算机视觉领域广泛而复杂,因此解决方案并不总是很清晰。计算机视觉中的许多标准任务都需要特别考虑:分类,检测,分割,姿势估计,增强和恢复以及动作识别。
图像分割中的一些常见的术语有:superpixels(超像素)、Semantic Segmentation(语义分割)、Instance Segmentation(实例分割)、Panoptic Segmentation(全景分割)。他们之间到底有什么区别呢?