demi的博客 | 电子创新网 Imgtec 社区

图像处理：图像灰度化

demi 在周二, 10/16/2018 - 10:30 提交

灰度图像上每个像素的颜色值又称为灰度，指黑白图像中点的颜色深度，范围一般从0到255，白色为255，黑色为0。所谓灰度值是指色彩的浓淡程度，灰度直方图是指一幅数字图像中，对应每一个灰度值统计出具有该灰度值的象素数。

灰度就是没有色彩，RGB色彩分量全部相等。如果是一个二值灰度图象，它的象素值只能为0或1，我们说它的灰度级为2。用个例子来说明吧：一个256级灰度的图象，如果RGB三个量相同时，如：RGB(100,100,100)就代表灰度为100，RGB(50,50,50)代表灰度为50。

现在大部分的彩色图像都是采用RGB颜色模式，处理图像的时候，要分别对RGB三种分量进行处理，实际上RGB并不能反映图像的形态特征，只是从光学的原理上进行颜色的调配。

图像灰度化处理可以作为图像处理的预处理步骤，为之后的图像分割、图像识别和图像分析等上层操作做准备。

图像灰度化处理有以下几种方式：

1. 分量法

将彩色图像中的三分量的亮度作为三个灰度图像的灰度值，可根据应用需要选取一种灰度图像。

智能时代为何需要区块链技术

demi 在周二, 10/16/2018 - 09:28 提交

作者：蔡恒进

我们也许不会马上遭遇机器具有自我意识、反叛人类的危险，但是很可能制造了一个很偏执的机器。我们即使是想让机器为人服务，也有可能会出错，这并不是机器有意识造反，只需要某一个方面失控就能对人造成很深的伤害，因为它的速度和力量比人类强大太多，这才是很快就会来临的危险]

摩尔定律描述硬件发展是18个月芯片的能力翻一倍，现在AI的计算力，有统计表明是3.5个月翻一倍。虽然计算力本身不意味着AI的能力，但仍然能够说明AI进化的速度多么恐怖。

进入智能时代，当人类的能力一项一项地被机器超越，我们必然将重新面对一个哲学上的终极命题：人生存的意义到底是什么？现在的计算机可谓是大脑的延伸，对人类的脑力劳动产生了取代的可能，那我们还有哪些不可替代的价值呢？

形势虽严峻，答案并不悲观，区块链技术为人类提供了一个可能的应对方案。我们不能禁止人们去创造人工智能，但是我们可以通过区块链技术对发展的进度进行追踪与评估。

人类的独特性与面临的挑战

有了人工智能的帮助，探索太空效率能提高10倍吗？

demi 在周一, 10/15/2018 - 17:41 提交

据SingularityHub报道，太空探索中的人工智能(AI)正在蓄势待发。在未来几年里，当我们前往彗星、卫星和行星，并探索在小行星上采矿的可能性时，新的任务看起来可能会得到AI的巨大帮助。

欧洲航天局(ESA)高级概念和研究办公室主任利奥波德·萨默斯(Leopold Summerer)在接受采访时说:“AI已经改变了游戏规则，使科学研究和探索更加高效。AI不仅让这种效率翻倍，而是提高了10倍。”

例证比比皆是

AI在太空探索中应用的历史比许多人想象的要久远得多。AI已经在研究我们的星球、太阳系和宇宙方面发挥了重要作用。随着计算机系统和软件的发展，AI的潜在用例也在不断增加。

地球观察者1号(EO-1)卫星就是个很好的例子。自本世纪初发射以来，其机载AI系统帮助优化了对自然灾害(如洪水和火山爆发)的分析和响应。在某些情况下，AI甚至能够让地球观察者1号卫星在地勤人员意识到事故发生之前就开始拍摄图像。

关于机器学习，你应该知道的3个热门专业术语

demi 在周一, 10/15/2018 - 15:22 提交

作者：吴郦军、罗人千

编者按：如果你是刚入门机器学习的AI探索者，你知道什么是胶囊网络吗？AutoML和元学习又是什么？为了帮大家节省查阅晦涩难懂的论文的时间，我们邀请微软亚洲研究院机器学习组实习生吴郦军、罗人千帮大家用最通俗的语言解释了这三个机器学习领域的热门词汇，赶紧收藏吧！

胶囊网络Capsule Networks

胶囊网络（Capsule Networks）是深度学习三巨头之一的Geoffrey Hinton提出的一种全新的神经网络。最初发表在2017年的NIPS会议上：Dynamic Routing Between Capsules。胶囊网络基于一种新的结构——胶囊（Capsule），通过与现有的卷积神经网络（CNN）相结合，从而在一些图像分类的数据上取得了非常优越的性能。

何谓胶囊？简单来说，胶囊就是将原有大家熟知的神经网络中的个体神经元替换成了一组神经元组成的向量，这些神经元被包裹在一起，组成了一个胶囊。因此，胶囊网络中的每层神经网络都包含了多个胶囊基本单元，这些胶囊与上层网络中的胶囊进行交互传递。

2018-10-15 11:40:49 +0800

demi 在周一, 10/15/2018 - 14:28 提交

作者：王学宽

深度学习到底有多热，这里我就不再强调了，也因此有很多人关心这样的几个问题，“适不适合转行深度学习（机器学习）”，“怎么样转行深度学习（机器学习）”，“转行深度学习需要哪些入门材料？”等等。

而网上相应问题的回答也比较杂乱，存在不走心、不够基础等等问题。

考虑到太多的人没有一定的专业基础，又恰恰对转行、学习的问题比较关心，因此，本文希望从一个小白的角度出来，真正从零基础的角度来为大家提供一些专业的建议和指导.

避免大家看很多无用的信息，少走弯路。接下来，本文从以下几个方向出发，来展开叙述：
1. 什么样的人适合入行深度学习？
2. 怎样学习深度学习？
3. 有哪些入门深度学习的材料推荐？

哪些人适合入行深度学习

深度学习存在一定的门槛，这是必然的，并不是网上说的仅仅成为一个“调包狭”。你可能是结合一些实际的业务场景，需要复现一些模型，甚至自己设计一些模型，所以需要具备一定的数学、英语、编程等等能力。

1. 初中毕业、高中毕业是否适合学习深度学习？

强人工智能基本问题：全局控制与自组织

demi 在周一, 10/15/2018 - 11:40 提交

大脑是非常复杂的，研究强人工智能需要参考大脑的结构和算法，来理解并创造智能。人脑算法、结构的秘密都隐藏在DNA和人存在的世界中。从现在的哲学和科学的认知来看，可认为人脑是自组织的，没有明确的全局目标函数。而自组织是大脑非常重要的一个特点。自组织最大的好处是人工介入少，这是对智力生产力的解放，代表了下一代生产力。

当前的人工神经网络算法以全局控制为主流。虽然有一部分自组织的算法，但是其应用范围非常小。所谓全局控制，即需要比人工神经网络更高级的观察者来控制神经网络，比如设定神经网络的目标，选择其算法，设定参数等。而自组织系统则最小化对系统的初始设定，把其余部分交给神经网络系统自己去调整。

在全局控制的神经网络系统中，全局控制的部分包括：

1）神经网络算法和数据结构。现在已经出现了很多神经网络算法，它们有各自的优势和其擅长解决的问题。在解决实际问题中需要根据经验，或各种方案都试验一下，来看看哪种算法给出的结果更好，并决定所使用的算法。一般在算法决定后，数据结构也随之决定了。

2）神经网络规模。在通常的机器学习算法中，都在设计模型的过程中决定每个模型的规模。规模太大运算复杂度太高，规模太小则无法得出足够精确的结果。

「值得收藏」工业互联网未来十大趋势

demi 在周一, 10/15/2018 - 10:50 提交

近年来，全球各个主要国家都制定了传统工业向智能化转型的行动计划，继德国提出工业4.0计划后，我国也提出了中国制造2025计划。基于我国产业链条完备和产业规模庞大的工业基础，大力发展智能产业必将使中国产业和经济迎来又一波的发展高潮。立足中国工业互联网发展基础，未来中国工业互联网将呈现十大演进趋势。

一、工业数据从信息割据到无边界流通

传统的工业企业数据不仅在企业与企业间产生割据状态，同一企业的生产、设计、研发、管理、运营等环节都存在割据的状态。所谓工业互联网，是基于各种网络互联技术，从工业设计、工艺、生产、管理、服务等涉及企业从创立到结束的全生命周期串联起来。将赋能整个工业系统使其拥有描述、诊断、预测、决策、控制的智能化功能。

二、信息化工具从单机软件到工业APP

神经符号系统：让机器善解人意

demi 在周一, 10/15/2018 - 09:22 提交

深度学习和符号智能的结合将是下一代自然语言理解的新范式，也是解决自然语言理解这个困难任务的唯一路径。

1. 通往语言理解之路

什么是理解

自然语言理解是人工智能的核心课题之一，也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间，都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻，它一方面承载着机器和人的交流，另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯，机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA（Ask Me Anything）栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

那么究竟什么是自然语言理解呢？我们可以认为，理解是从自然语言到语义的映射，但是这个定义只是把问题转移到了「语义」的定义上，而关于语义，一直缺乏在形式和功能上都普遍适用的定义。事实上，语义往往需要被放在特定领域和特定语境下去考量，比如一句「你开心就好」，可以在不同的场景下传达鄙视和祝愿等多种意思。关于理解或者语义，我们不得不采取了下面两种耍赖式的定义来刻画它们的不同侧面：

如何基于深度学习实现图像的智能审核？

demi 在周五, 10/12/2018 - 17:01 提交

背景

美团每天有百万级的图片产生量，运营人员负责相关图片的内容审核，对涉及法律风险及不符合平台规定的图片进行删除操作。由于图片数量巨大，人工审核耗时耗力且审核能力有限。另外对于不同审核人员来讲，审核标准难以统一且实时变化。所以有必要借助机器实现智能审核。

图像智能审核一般是指利用图像处理与机器学习相关技术识别图像内容，进而甄别图像是否违规。图像智能审核旨在建立图片自动审核服务，由机器自动禁止不符合规定（负例）的图片类型，自动通过符合规定（正例）的图片类型，机器不确定的图片交由人工审核。因此，衡量智能审核系统性能的指标主要是准确率和自动化率。

图像处理分类、一般流程与算法

demi 在周五, 10/12/2018 - 11:53 提交

常用的图像处理算法：数字图像处理基础、遥感数字图像处理、机器视觉、计算机视觉

图像处理程序：C++ OpenCV、Matlab与图像处理

数字图像处理-概述

其实，造成“不可能图形”（三角形的三个角都是90°）的并不是图形本身，而是你对图形的三维知觉系统，这一系列在你知觉图形的立体心理模型时强制作用。在把二维平面图形知觉为你三维立体心理图形时，执行这一过程的机制会极大地影响你的视觉系统。

正是在这一强制执行的机制的影响下，你的视觉系统对图形中的每一个点都赋予了深度。换句话说，一幅图像的某些二维结构元素和你三维知觉解释系统的某些结构元素相对应。二维直线被解释成三维直线。二维的平面被解释为三维的平面。在透视图像中，锐角和钝角都被解释为90°角。外面的线段被看作是外形轮廓的分界线。这一外形分界线在你定义整个心理图像的外形轮廓时起着及其重要的作用。这说明，在没有相反信息的影响下，你的视觉系统总是假定你从一个主要视角观看事物。

三角形的每一个顶角都产生透视，三个90°的角，而且，每条边的距离变化不同。把三个顶角合成一个整体，就产生了一个空间不可能图形。

相对性：环境对比的影响