demi的博客

一文看懂深度学习改变的五大计算机视觉技术

本文主要介绍计算机视觉中主要的五大技术,分别为图像分类、目标检测、目标跟踪、语义分割以及实例分割。针对每项技术都给出了基本概念及相应的典型方法,简单通俗、适合阅读。计算机视觉是当前最热门的研究之一,是一门多学科交叉的研究,涵盖计算机科学(图形学、算法、理论研究等)、数学(信息检索、机器学习)、工程(机器人、NLP等)、生物学(神经系统科学)和心理学(认知科学)。由于计算机视觉表示对视觉环境及背景的相对理解,很多科学家相信,这一领域的研究将为人工智能行业的发展奠定基础。

卷积神经网络(CNN)——从图像分类到图像分割

从图像分类到图像分割

卷积神经网络(CNN)自2012年以来,在图像分类和图像检测等方面取得了巨大的成就和广泛的应用。

CNN的强大之处在于它的多层结构能自动学习特征,并且可以学习到多个层次的特征:较浅的卷积层感知域较小,学习到一些局部区域的特征;较深的卷积层具有较大的感知域,能够学习到更加抽象一些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低,从而有助于识别性能的提高。

这些抽象的特征对分类很有帮助,可以很好地判断出一幅图像中包含什么类别的物体,但是因为丢失了一些物体的细节,不能很好地给出物体的具体轮廓、指出每个像素具体属于哪个物体,因此做到精确的分割就很有难度。

传统的基于CNN的分割方法的做法通常是:为了对一个像素分类,使用该像素周围的一个图像块作为CNN的输入用于训练和预测。

移动和无线网络的深度学习综述(一)

作者:陆勤。最近开始研究通信领域的先进机器学习技术,本科学的是通信工程,工作做的是机器学习,5G的到来,智能移动网络的需求和应用,预示着通信领域需要先进的机器学习技术,同时,也会带来新的挑战和机遇。

笔记:Unity的常用API

1、Event Function:事件函数

  • Reset() :被附加脚本时、在游戏物体的组件上按Reset时会触发该事件函数
  • Start() :在游戏初始化时会执行一次
  • Update() :每一帧都会运行这个方法
  • FixedUpdate(): 会在指定帧调用该方法多少次
  • LateUpdate(): 晚于Update的运行顺序,但是FPS和Update是一样的
  • Awake() Start() : 都是在游戏物体初始化运行一次,但是Awake的运行顺序高于Start的,并且只要脚本中存在Awake方法,则无论是否挂载了该脚本都会执行该方法
  • OnEnable(): 当将物体的SetActive设置为true时就会自动调用调用该方法
  • OnDestory(): 当关闭游戏则会调用该方法

2、Time时间类函数:

纹理过滤模式中的Bilinear、Trilinear以及Anistropic Filtering

为什么在纹理采样时需要texture filter(纹理过滤)?我们的纹理是要贴到三维图形表面的,而三维图形上的pixel中心和纹理上的texel中心并不一至(pixel不一定对应texture上的采样中心texel),大小也不一定一至。当纹理大于三维图形表面时,导至一个像素被映射到许多纹理像素上;当维理小于三维图形表面时,许多个象素都映射到同一纹理。

不容错过:10本让你成为机器学习领域的专家的好书!

机器学习是个跨领域的学科,而且在实际应用中有巨大作用,但是没有一本书能让你成为机器学习的专家。

在这篇文章中,我挑选了10本书,这些书有不同的风格,主题也不尽相同,出版时间也不一样。因此,无论你是新手还是领域专家,一定能找到适合你的。

新手的最佳读物

这本书绝对是初学者非常期待的入门书。这本书条理清晰,学习成本低,因此我把它列为新手的最佳读物。

下面让我们深入讨论一些关于人工智能程序的话题。

人工智能编程范例

如果您想接触最新的人工智能技术,那么Peter Norvig写的人工智能编程范例将非常适合。

缓解游戏开发压力的五大建议

一直以来,有件令人悲哀的事实:压力对于游戏开发者来说是一种很正常的事情。当游戏交期来临时、开发过程中意想不到的问题出现需要解决时、工作学习过程中(当这些状况出现时候,或者需要使用之前从未使用过的软件时)等等,存在很多原因给开发者带来压力。

然而幸运的是,目前有一些方法能帮助开发者减轻压力。互联网行业中的每个人都应该学习一下这些方法,否则压力太大会造成低效率的工作且影响团队整体工作。毕竟,整个游戏开发的本质是:团队合作。

这些建议对于缓解压力是方便有效的。

1、时刻铭记你不是一个人

在任何的工作室中,无论是大的还是小的,远程还是现场办公,一个项目都是由大家共同完成。项目任务分配给每个人,你也不例外,所以在整个过程中你并不孤单。显而易见,并不是当你开始一个项目时就要一直独自盯着它一个月。

每件事情并不是只有给你带来压力和挫败感,记住每个人也会感觉有些精疲力尽。这不是你自己一个人的感受,整个团队都会有这样的感觉。

2、不要害怕寻求帮助

GPU渲染流水线的简单概括

GPU流水线主要分为两个阶段:几何阶段和光栅化阶段

几何阶段

顶点着色器 ——> 曲面细分着色器(可选)----->几何着色器(可选)----->裁剪——>屏幕映射

顶点着色器
流水线的第一个阶段,输入来自于CPU,处理的基本单位为单个顶点,输入的每个顶点都会调用一次顶点着色器。

主要工作是:坐标变换(比如改变顶点位置模拟水面、布料等)和逐顶点光照,并输出后续阶段需要的数据(常见的输出路径是经光栅化后交给片元着色器处理)。

曲面着色器
一个可选的着色器,用于细分图元。

几何着色器
用于执行逐图元操作,或者用于产生更多的图元

裁剪
将不在摄像机视野的顶点裁剪掉,并剔除某些三角图元的面片(主要处理一部分在视野内另一部分在视野外的图元。

图像特征提取(形状特征,空间关系特征)

一 、形状特征

(一)特点

各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,包括:
①目前基于形状的检索方法还缺乏比较完善的数学模型;
②如果目标有变形时检索结果往往不太可靠;
③许多形状特征仅描述了目标局部的性质,要全面描述目标常对计算时间和存储量有较高的要求;
④许多形状特征所反映的目标形状信息与人的直观感觉不完全一致,或者说,特征空间的相似性与人视觉系统感受到的相似性有差别。
另外,从2-D图像中表现的3-D物体实际上只是物体在空间某一平面的投影,从2-D图像中反映出来的形状常不是3-D物体真实的形状,由于视点的变化,可能会产生各种失真。

(二)常用的特征提取与匹配方法

1. 几种典型的形状特征描述方法

机器学习算法选用指南

摘要: 本文对机器学习的一些基本概念给出了简要的介绍,并对不同任务中使用不同类型的机器学习算法给出一点建议。

在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题。虽然有很多有关机器学习算法的文章详细介绍了相关的算法,但要做出最合适的选择依然非常困难。

在这篇文章中,我将对一些基本概念给出简要的介绍,对不同任务中使用不同类型的机器学习算法给出一点建议。在文章的最后,我将对这些算法进行总结。

首先,你应该能区分以下四种机器学习任务:
  •   监督学习
  •   无监督学习
  •   半监督学习
  •   强化学习

监督学习

监督学习是从标记的训练数据中推断出某个功能。通过拟合标注的训练集,找到最优的模型参数来预测其他对象(测试集)上的未知标签。如果标签是一个实数,我们称之为回归。如果标签来自有限数量的值,这些值是无序的,那么称之为分类。