mengqiqi 的blog

人工智能VS机器学习VS深度学习VS人工神经网络

在经历了蛮荒的PC互联网时代,混战的移动互联网时代,到现今最火的人工智能时代。大数据、云计算、机器学习的技术应用,已经使得IT从业者的门槛越来越高。套用一句樊登读书会的宣传口号“keep learning”,保持对新鲜技术的好奇心,保持对技术应用的责任心,持续关注、学习是每个IT从业者的必备技能。

一、什么是人工智能?

人工智能VS机器学习VS深度学习VS人工神经网络

人工智能(Artificial Intelligence),英文缩写为AI。

它是一个融合计算机科学、统计学、脑神经学和社会科学的前沿综合学科。

它使得计算机像人一样拥有智能能力,可以代替人类实现识别、认知,分析和决策等多种功能。

比如当你说一句话时,机器能够识别成文字,并理解你话的意思,进行分析和对话等。

二、人工智能发展简史

机器学习项目失败的9个原因,你中招了吗?

本文总结了数据科学项目失败的最常见原因,希望能够帮助你避免陷阱。

1. 问错了问题

如果你问了错问题,你将会得到错误的答案。比如金融业中的欺诈识别问题,这个问题最初可能是“这个特定的交易是否存在欺诈”。为了确定这一问题,你将需要一个包含欺诈和非欺诈交易示例的数据集。这个数据集可以在一组专门负责侦测欺诈行为的专家(SME)的帮助下生成。但是,由于专家们依据的是过去对欺诈行为的认识进行的标记,用该数据集训练的模型只会捕获符合旧模式欺诈,而对于新兴的欺诈方式,这一模型将无法识别。如果将问题改为“这个交易是否反常”,它只需寻找不符合“正常”签名的交易,依靠人类进一步分析预测的欺诈交易以验证模型结果即可。但这种方法的副作用是,它很可能会比以前的模型产生更多的误报。

2. 试图用它来解决错误的问题

我们经常会忽视一个问题:我们费尽心思解决了一个问题,但是解决后是否能实现我们的目的。比如,你想出了用人工智能开发出一个将人的全身照传上网站就能根据提醒量身定做一套合身的衣服的项目。完成这个项目我们需要完成以下任务:

  •  开发AI/ML技术以确定照片中的身体测量值;

【深度学习】L1正则化和L2正则化

在机器学习中,我们非常关心模型的预测能力,即模型在新数据上的表现,而不希望过拟合现象的的发生,我们通常使用正则化(regularization)技术来防止过拟合情况。正则化是机器学习中通过显式的控制模型复杂度来避免模型过拟合、确保泛化能力的一种有效方式。如果将模型原始的假设空间比作“天空”,那么天空飞翔的“鸟”就是模型可能收敛到的一个个最优解。在施加了模型正则化后,就好比将原假设空间(“天空”)缩小到一定的空间范围(“笼子”),这样一来,可能得到的最优解能搜索的假设空间也变得相对有限。有限空间自然对应复杂度不太高的模型,也自然对应了有限的模型表达能力。这就是“正则化有效防止模型过拟合的”一种直观解析。

【深度学习】L1正则化和L2正则化

L2正则化

机器视觉中不同类型光源的不同打光方式的效果探究

有经验的机器视觉工程师都会认可这样一句话:机器视觉项目的成败在于能否得到一张打光优秀的图片。如果采集到的图片本身“质量”很差,那么接来下的图像处理工作就会困难重重。

由于项目的需求以及光源厂商的努力,目前机器视觉光源的类型可以说十分丰富,例如条光、背光、平行背光、同轴光、点光、隧道光、碗光、环形光、球形光、条形聚光等。根据光的波长和颜色,又可以分为X光、蓝光、红光、白光、红外光等。

网上关于光源选型方面的资料多如牛毛,我不想再重复,我想说点其他的。

在光源大家族中,有一种光最为灵活多变,它就是环形光。环形光有低角度环形光、高角度环形光等不同类型,例如0°环形光、30°环形光、45°环形光、60°环形光、90°环形光等。

不同的资料对于这个环光的“角度”定义不同,有的指“光源照射方向与水平面的夹角”,有的指“光源照射方向与镜头光轴(一般是竖直方向)的夹角”。本文采用后一种定义方式来描述。

为什么说环形光的花样多呢?因为它的口径可以不同、它的“角度”可以不同、它的光的颜色可以不同、它的安装高度也可以不同(其他光源安装高度不同差异一般不会有这么大)。

下面我以拍摄镜头模组为例,采用不同“角度”的环形光,沿着镜头光轴方向在不同高度分别采集图像,大家可以观察图像的特点与变化。

机器学习优化算法:梯度下降、牛顿法、拟牛顿法

1、梯度下降法

梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的。

梯度下降法的优化思想:用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以也被称为是”最速下降法“。最速下降法越接近目标值,步长越小,前进越慢。

缺点:
(1)靠近极小值时收敛速度减慢,求解需要很多次的迭代;
(2)直线搜索时可能会产生一些问题;
(3)可能会“之字形”地下降。

2、牛顿法

牛顿法最大的特点就在于它的收敛速度很快。

优点:二阶收敛,收敛速度快;

缺点:
  •   牛顿法是一种迭代算法,每一步都需要求解目标函数的Hessian矩阵的逆矩阵,计算比较复杂。
  •   牛顿法收敛速度为二阶,对于正定二次函数一步迭代即达最优解。
  •   牛顿法是局部收敛的,当初始点选择不当时,往往导致不收敛;
  •   二阶海塞矩阵必须可逆,否则算法进行困难。

关于牛顿法和梯度下降法的效率对比:

2018年全球AI突破性技术TOP10

人工智能是个高科技、宽领域、多维度、跨学科的集大成者,从立足大数据、围绕互联网的纯计算机应用,逐步衍生到人们日常生产生活的方方面面,在细微之处改善和改变着我们。目前,不少新技术、新模式已经逐步投入到现实运用,但是多数领域仍然处在推广、试验、研究阶段,如何把握推广人工智能技术的重大机遇,让人们像普及手机一样用上人工智能,这是我们这一代人必须面对的时代发展“必答题”。

2018年人工智能技术已在多方面实现突破性进展,国内外的科技公司都在不断尝试将人工智能应用于更多领域,不论科技巨头还是初创企业,都在致力于不断创新,推动技术进步,接下来我们就来看看十项中外人工智能领域富有突破性的技术。

一、基于神经网络的机器翻译

入选理由:翻译是“自然语言处理”的最重要分支,也是比较难的一支。早年间,机器翻译还被视作 “低级翻译”被嘲讽,如今神经网络的机器翻译准确性大大提高,堪比专业人工翻译。我们熟知的谷歌翻译、微软语音翻译以及搜狗语音识别等都是基于此项技术。

技术突破:机器翻译是科研人员攻坚了数十年的研究领域,其技术核心是一个拥有海量结点的深度神经网络,它可以自动的从语料库中学习翻译知识。由于神经网络能够比较好地模拟人脑神经元多层深度传递的过程,它在解决一些复杂问题的时候有着非常明显的突破性表现。

智慧安防中的生物特征识别门禁系统

近几年,随着生物特征识别技术的不断发展成熟,生物特征识别技术在门禁系统中的应用逐渐变成主流。生物特征识别门禁系统是以人的生物特征为识别条件的门禁系统,主要包括对人脸识别、指纹识别、虹膜识别、掌纹识别、指静脉识别、声纹识别等。

总体来说,生物识别门禁的发展呈螺旋上升趋势,目前在智慧安防、视频监控、楼宇对讲、智能社区、地铁保安、智慧银行等领域的应用极大的便捷了人们的生活,它似乎不在像从前那么高不可攀。

指纹识别门禁系统

指纹门禁系统的硬件主要由微处理器、指纹识别模块、液晶显示模块、键盘、时钟/日历芯片、电控锁和电源等组成。微处理器作为系统的上位机,控制整个系统。指纹识别模块主要完成指纹特征的采集、比对、存储、删除等功能。液晶显示器模块用于显示开门记录、实时时钟和操作提示等信息,和键盘?起组成人机界。

指纹读取装置(采集器)采用光电技术或电容技术将指纹信息采集下来、然后进行特征提取并与已存储的特征信息比对,完成识别过程。这个过程全部在读取装置中完成,也可以是读取装置仅进行指纹采集,然后将其传送到后台设备(如PC)完成特征提取和识别。单独进行指纹采集的装置易于小型化,使用方便,系统识别速度也较快。进行指纹特征采集要求在操作时人的手指与采集器建立规定的关系.所以系统友好性稍差。

自然语言处理中的Attention Model:是什么及为什么

作者:张俊林

要是关注深度学习在自然语言处理方面的研究进展,我相信你一定听说过Attention Model(后文有时会简称AM模型)这个词。AM模型应该说是过去一年来NLP领域中的重要进展之一,在很多场景被证明有效。听起来AM很高大上,其实它的基本思想是相当直观简洁的。

Encoder-Decoder框架

本文只谈谈文本处理领域的AM模型,在图片处理或者(图片-图片标题)生成等任务中也有很多场景会应用AM模型,但是我们此处只谈文本领域的AM模型,其实图片领域AM的机制也是相同的。

要提文本处理领域的AM模型,就不得不先谈Encoder-Decoder框架,因为目前绝大多数文献中出现的AM模型是附着在Encoder-Decoder框架下的,当然,其实AM模型可以看作一种通用的思想,本身并不依赖于Encoder-Decoder模型,这点需要注意。

Encoder-Decoder框架可以看作是一种文本处理领域的研究模式,应用场景异常广泛,本身就值得非常细致地谈一下,但是因为本文的注意力焦点在AM模型,所以此处我们就只谈一些不得不谈的内容,详细的Encoder-Decoder模型以后考虑专文介绍。

DPI与DFI技术分析

DPI全称为“Deep Packet Inspection”,称为“深度包检测”。DPI技术在分析包头的基础上,增加了对应用层的分析,是一种基于应用层的流量检测和控制技术,当IP数据包、TCP或UDP数据流经过基于DPI技术的带宽管理系统时,该系统通过深入读取IP包载荷的内容来对OSI7层协议中的应用层信息进行重组,从而得到整个应用程序的内容,然后按照系统定义的管理策略对流量进行整形操作。

针对不同的协议类型,DPI识别技术可划分为以下三类:

第一类是特征字的识别技术:不同的应用通常会采用不同的协议,而各种协议都有其特殊的指纹,这些指纹可能是特定的端口、特定的字符串或者特定的Bit序列。基于特征字的识别技术,正是通过识别数据报文中的指纹信息来确定业务所承载的应用。根据具体检测方式的不同,基于特征字的识别技术又可细分为固定特征位置匹配、变动特征位置匹配和状态特征字匹配三种分支技术。通过对指纹信息的升级,基于特征字的识别技术可以方便的扩展到对新协议的检测。

GDPR到底是如何影响机器学习的?

一般数据保护条例(GDPR)对数据科学产生了很大的影响。现在GDPR有99条正文条款和173篇声明(Recital),长而复杂,但是随着时间的推移以及条款的执行,它可能会变得更加复杂。同时,由于GDPR的存在,律师和隐私工程师将成为未来大型数据科学项目的核心组成部分。

本文主要讨论GDPR与机器学习(ML)之间三个最常见的问题。

1.GDPR是否禁止机器学习?

总的来说,在GDPR生效后,ML不会在欧盟被禁止。

但是,从技术的角度来看,这个问题的答案是肯定的。GDPR作为法律条文,确实做出了对使用自动化决策的全面禁止的规定。当GDPR使用“自动化决策”这个术语时,该法规指的是任何模型都可以在没有人直接参与决策的情况下做出决定。这可能包括数据主体的自动“概要分析”,例如将其分类为“潜在客户”或“40-50岁男性”等特定组,以确定贷款申请人是否有资格获得贷款。

因此,GDPR对ML模型的产生的影响是在没有人直接参与决策制定的情况下,它们是否可以自动部署。如果可以自动部署,那么在大量的ML模型中这种自动部署的设置将会被默认禁止。尽管有许多律师或数据科学家确实反对过,但参与起草和解释GDPR的欧盟官方工作组还是坚持该项规定。

同步内容
--电子创新网--
粤ICP备12070055号