demi的博客

卷积神经网络之卷积计算、作用与思想

卷积运算与相关运算

在计算机视觉领域,卷积核、滤波器通常为较小尺寸的矩阵,比如 3 × 3 、5 × 5 等,数字图像是相对较大尺寸的2维(多维)矩阵(张量),图像卷积运算与相关运算的关系如下图所示(图片来自链接),其中 F 为滤波器,X 为图像,O 为结果。

卷积神经网络之卷积计算、作用与思想

相关是将滤波器在图像上滑动,对应位置相乘求和;卷积则先将滤波器旋转180度(行列均对称翻转),然后使用旋转后的滤波器进行相关运算。两者在计算方式上可以等价,有时为了简化,虽然名义上说是“卷积”,但实际实现时是相关。

Gartner公布十大战略物联网技术和趋势

Gartner今天强调了最重要的几大战略物联网(IoT)技术趋势,并称这些趋势将推动2018年至2023年期间的数字业务创新。

Gartner研究副总裁Nick Jones表示:“物联网将继续为未来十年的数字业务创新提供新的机遇,其中很多创新将通过新技术或改进技术实现。那些掌握了创新物联网趋势的CIO们才有机会在其业务中领导数字化创新。”

此外,CIO们应该确保他们拥有必要的技能和合作伙伴,以支持关键的新兴物联网趋势和技术,因为到2023年CIO们负责的端点数量将是今年的3倍多。

Gartner列出了10项最具战略意义的物联网技术和趋势,这些技术和趋势将实现新的收入流和业务模式,以及新的体验和关系:

趋势1:人工智能(AI)

Gartner预测,到2019年使用中的联网事物将达到142亿个,到2021年将达到250亿个,这都会产生海量的数据。Jones说:“数据是物联网的动力,推动着企业组织从中获取洞察以实现长期成功。人工智能将被应用于广泛的物联网信息中,包括视频、静止图像、语音、网络流量活动和传感器数据等。”

机器人视觉系统包括哪些关键技术?

机器人视觉系统是指用计算机来实现人的视觉功能,也就是用计算机来实现对客观的三维世界的识别。人类接收的信息70%以上来自视觉,人类视觉为人类提供了关于周围环境最详细可靠的信息。

人类视觉所具有的强大功能和完美的信息处理方式引起了智能研究者的极大兴趣,人们希望以生物视觉为蓝本研究一个人工视觉系统用于机器人中,期望机器人拥有类似人类感受环境的能力。机器人要对外部世界的信息进行感知,就要依靠各种传感器。就像人类一样,在机器人的众多感知传感器中,视觉系统提供了大部分机器人所需的外部世界信息。因此视觉系统在机器人技术中具有重要的作用。

依据视觉传感器的数量和特性,目前主流的移动机器人视觉系统有单目视觉、双目立体视觉、多目视觉和全景视觉等。

单目视觉

单目视觉系统只使用一个视觉传感器。单目视觉系统在成像过程中由于从三维客观世界投影到N维图像上,从而损失了深度信息,这是此类视觉系统的主要缺点( 尽管如此,单目视觉系统由于结构简单、算法成熟且计算量较小,在自主移动机器人中已得到广泛应用,如用于目标跟踪、基于单目特征的室内定位导航等。同时,单目视觉是其他类型视觉系统的基础,如双目立体视觉、多目视觉等都是在单目视觉系统的基础上,通过附加其他手段和措施而实现的。

机器学习(九)——逻辑回归与SVM区别

1、LR和SVM有什么相同点

(1)都是监督分类算法,判别模型;

(2)LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况下可以处理多分类问题);

(3)两个方法都可以增加不同的正则化项,如L1、L2等等。所以在很多实验中,两种算法的结果是很接近的。

2、LR和SVM有什么不同点

(1)本质上是其loss function不同;

区别在于逻辑回归采用的是Logistical Loss,SVM采用的是hinge loss.这两个损失函数的目的都是增加对分类影响较大的数据点的权重,减少与分类关系较小的数据点的权重。

逻辑回归损失函数:
机器学习(九)——逻辑回归与SVM区别

摧毁程序员生产力的 12 件事

身为技术主管和工程经理,我们经常遇到的问题是如何提高团队的效率。但是在你集中精力提高他们的工作效率之前,你可能首先要考虑是什么在破坏他们的工作效率,并建立起良好的基础。

程序员想要完成什么工作,根本离不开电脑,但确实还有很多公司希望程序员不使用电脑就能完成工作(你敢信)。

因此,我们列出了12件阻碍程序员提高效率的事情。下面给出的顺序是按最重要到不重要的排序的(从我的视角),请大家斧正。

其实吧,给程序员们加薪也是个好办法,哪怕加薪10%,也能起到相当不错的激励作用。

1) 干扰&会议

在我看来,随意打断是程序员的工作最影响他们效率的事情。开发人员无法轻松回到被打断之前的状态。他们需要再次找到感觉,然后继续上手原来的工作。干扰越多,挫折越大,质量越低,bug就越多——而且还在继续。

我越被干扰,效率就越低。每次被打断了工作流程,我就得重新开始找感觉,所以如果我一天被多次打断,这一天想要又什么成果基本就不可能了。——一位程序员如是说道

5 种最流行的深度学习架构

连接主义体系结构已存在 70 多年,但新的架构和图形处理单元 (GPU) 将它们推到了人工智能的前沿。深度学习架构是最近 20 年内诞生的,它显著增加了神经网络可以解决的问题的数量和类型。本文将介绍 5 种最流行的深度学习架构:递归神经网络 (RNN)、长短期记忆 (LSTM)/门控递归单元 (GRU)、卷积神经网络 (CNN)、深度信念网络 (DBN) 和深度叠加网络 (DSN),然后探讨用于深度学习的开源软件选项。

深度学习不是单个方法,而是一类可用来解决广泛问题的算法和拓扑结构。深度学习显然已不是新概念,但深度分层神经网络和 GPU 的结合使用加速了它们的执行,深度学习正在突飞猛进地发展。大数据也助推了这一发展势头。因为深度学习依赖于监督学习算法(这些算法使用示例数据训练神经网络并根据成功水平给予奖惩),所以数据越多,构建这些深度学习结构的效果就越好。

深度学习与 GPU 的兴起

光与介质:基于物理的渲染和着色理论

此文对于程序员和美术制作人员都有很大的帮助作用,希望你看完后对基于物理的渲染有个整体的理解,此篇翻译的文章(The Comprehensive PBR Guide by Allegorithmic - vol. 1)基本上是从美术的角度来解释基于物理的渲染,有时间我会把程序部分的知识再细致讲一下,包括理论和实现,我自己目前也在学习阶段,主要在研究UE4的基于物理的渲染,希望在接下来的时间里出一个比较详细的文章来从程序员的角度详细阐述实现原理。

By 风恋残雪
博客:http://www.cnblogs.com/ghl_carmack/

光是一种复杂的现象,因为它同时具有波和粒子的属性。因此,创建了不同的模型来描述光的行为。作为制作贴图的美工,我们关心光-射线模型,因为它描述了光和介质是如何交互的。对于我们来说,理解光线如何跟介质表面交互很重要,因为我们的工作就是要制作描述那个表面的贴图。我们制作的贴图和材质用来在虚拟世界中跟光线交互,我们对光如何表面了解得越多,我们制作的贴图看起来就越好。

区块链未来的发展趋势,你真的清楚吗?

区块链的概念最早源自比特币,已经存在8年之久了。随着区块链近年来市场热度持续升温,越来越多的行业及企业开始关注区块链技术领域。那么区块链未来的发展趋势究竟如何,你是否清楚呢?毋庸置疑,国内的区块链目前还处于萌芽发展的阶段,要想走向更成熟的阶段也许还需要5--10年,甚至更长的时间。不过从目前在国内的发展状况看,这并不妨碍价值投资者对区块链寄予的厚望。我国在“十三五”规划中明确指出要强化区块链等战略性前沿技术并进行超前布局。我国区块链企业数量不断增长,其中2014 年单年度新增区块链企业数量最多。与全球区块链领域投资相比,中国区块链产业投融资起步稍晚,2016年明显加速,较2015年增长了293%。2017年区块链更是开始运用到更多的行业,电商、共享单车平台等,可见其发展前景是很好的。

【图像处理】ISP 图像传感器camera原理

1、Color Filter Array — CFA

随着数码相机、手机的普及,CCD/CMOS 图像传感器近年来得到广泛的关注和应用。 图像传感器一般都采用一定的模式来采集图像数据,常用的有 BGR 模式和 CFA 模式。BGR 模式是一种可直接进行显示和压缩等处理的图像数据模式,它由 R( 红)、G( 绿) 、B( 蓝) 三原色值来共同确定 1 个像素点,例如富士数码相机采用的 SUPER CCD 图像传感器就采用这种模式,其优点是图像传感器产生的图像数据无需插值就可直接进行显示等后续处理,图像效果最好,但是成本高,常用于专业相机中。一般数码相机的传感器(CCD 或 CMOS)约占整机总成本的 10%~25%,为了减少成本,缩小体积,市场上的数码相机大多采用 CFA 模式,即在像素阵列的表面覆盖一层彩色滤波阵列(Color Filter Array,CFA),彩色滤波阵列有多种,现在应用最广泛的是 Bayer 格式滤波阵列,满足 GRBG 规律,绿色像素数是红色或蓝色像素数的两倍,这是因为人眼对可见光光谱敏感度的峰值位于中波段,这正好对应着绿色光谱成分。

自动机器学习(AutoML)最新综述

机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML 试图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。