demi的博客

简单易懂的讲解深度学习(入门系列之四)

在前一个小节中,简单地谈了谈什么是“M-P神经元模型”,顺便用生活中生动的小案例,把激活函数和卷积函数的概念撸了一遍。下笔之处,尽显“神经”。当然这里所谓的“神经”,是说我们把不同领域的知识,以天马行空地方式,揉和在一起,协同提升认知水平。其实,这不也正是深度学习的前沿方向之一——“迁移学习(Multi-Task and Transfer Learning)”要干的事情吗?

下面,继续“神经”下去,首先聊聊机器学习的三大分支,然后以“中庸之道”来看机器学习的发展方向。

4.1 机器学习的三个层次

在我们小时候,大概都学习过《三字经》,其中有句“性相近,习相远。”说的就是,“人们生下来的时候,性情都差不多,但由于后天的学习环境不一样,性情也就有了千差万别。”

其实,这句话用在机器学习领域,上面的论述也是大致适用的。机器学习的学习对象是数据,数据是否有标签,就是机器学习所处的“环境”,“环境”不一样,其表现出来的“性情”也有所不同,大致可分为三类:

智能网联汽车信息安全建设十大常见误区

过去的二十年,汽车行业把大量的数字化技术应用在协同工作、设计开发、销售及服务等方面,因此信息安全建设过去几乎没有围绕汽车实施。同时由于生产环境和物理环境的相对封闭,我们也看到国内大量整车厂针对传统信息安全建设的缺位。信息安全不是个新话题,但是在汽车行业开始被重视并且实践,是近两年才开始的。

近年通过大量的走访、调研,我们发现汽车行业在智能网联汽车信息安全建设过程中,目前存在大量的建设误区,导致成本及资源的浪费,未来甚至可能埋下新的安全隐患。

因此我们总结了十大常见误区,供行业管理者参考:

1. 信息安全战略不清晰

智能网联汽车信息安全与车辆主被动安全不同,需要同时考虑人员、策略、技术等多维度的风险控制。而风险战略自上而下、由内而外都需要兼顾,需要调配供应链、IT、法务、风控、电子电器、车内网络甚至销售运维等多个部门,需要项目参与人都拥有相当的风险控制意识,需要在车辆的整个生命周期都贯彻风险管理措施……因此信息安全战略的缺失或者不完善,很大程度上会影响整车企业信息安全建设的走向。

自动驾驶中常用的四类机器学习算法

机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据融合(如激光雷达、雷达、摄像头或物联网),评估驾驶员状况或为驾驶场景分类等。在KDnuggets网站发表的一篇文章中,作者Savaram Ravindra将自动驾驶中机器学习算法主要分为四类,即决策矩阵算法、聚类算法、模式识别算法和回归算法。我们跟他一起看看,这些算法都是怎样应用的。

算法概览

我们先设想这样一个自动驾驶场景——汽车的信息娱乐系统接收传感器数据融合系统的信息,如果系统发现司机身体有恙,会指导无人车开往附近的医院。

这项应用以机器学习为基础,能识别司机的语音、行为,进行语言翻译等。所有这些算法可以分为两类:监督学习和无监督学习,二者的区别在它们学习的方法。

监督学习算法利用训练数据集学习,并会坚持学到达到所要求的置信度(误差的最小概率)。监督学习算法可分为回归、分类和异常检测或维度缩减问题。

揭秘7大最易忽略的攻击面

背景介绍

从纸笔办公到物联网时代,你知道哪些攻击面是攻击者最常利用,而我们又最常忽略的吗?

现在,在你的办公室中可能还有一些老旧的传真机或是布满灰尘的打印机,在你的眼中,它们或许只是已经无法用来发送邮件或复印文档的过时技术。你可能也会将收发室/信房视为收集未经请求的垃圾信件的地方,而这些垃圾信件很快就会被你丢进垃圾箱。

是的,如此寻常的物件,如此寻常的操作,可能每天都在我们的生活和工作中上演。但是,攻击者却能够从中发现一些不同的东西:漏洞,一些通常会被安全部门忽略的漏洞。要记住,非计算机向量上的网络攻击要比你想象的更常见。

例如,今年8月,Check Point公司的研究人员就披露了全球数以亿计传真机所使用的通信协议中存在的两个严重远程代码执行(RCE)漏洞。该攻击被称为Faxploit,其中涉及了两个缓冲区溢出漏洞,一个在解析COM标记时触发(CVE-2018-5925),另一个基于堆栈的问题在解析DHT标记(CVE-2018-5924)时发生,这可以导致远程代码执行。

AI+家庭安防:智能家居行业中一个不可小觑的市场

文章发于《智能家居》杂志,经亿欧家居编辑,供行业人士参考。

在人工智能、5G、IoT突破融合的趋势下,各地加速智慧城市建设,城市安防更是加深发展,利用深度学习技术来理解视频内容,使得安防领域成为人工智能技术最大应用场景之一。安防,被视为下一个即将爆发的市场,是国内现阶段人工智能直接创收最多的行业。据数据统计,目前国内大约装有1.76亿个监控摄像头,预计三年内数量会增加到6.26亿。未来每个新增摄像头的背后,AI都大有可为,预计到2022年整个市场将达到万亿规模。本文将重点探讨AI+安防在家庭、社区、楼宇等场景下的相关应用。

为何AI技术纷纷落地安防行业?

安防领域一直被认为是人工智能技术落地最好的行业之一。而这主要源于安防本身的两大特性:首先,以视频技术为核心的安防行业拥有海量的数据来源,可以充分满足人工智能对于算法模型训练的要求;其次,安防行业中事前预防、事中响应、事后追查的诉求与人工智能的技术逻辑完全吻合。

而从目前市场现状来看,鉴于安防领域巨大的市场规模和可观的营收利润前景,也恰恰使其成为众多AI巨头以及创业公司的必争之地。

十项最具发展潜力的机器人技术

时下机器人技术发展火热,随着人们对机器人技术智能化本质认识的加深,机器人技术开始源源不断地向人类活动的各个领域渗透。小编带大家来看十项最具前景的机器人技术!

「软体的机器人」:柔性机器人技术

该技术是指采用柔韧性材料进行机器人的研发、设计和制造。

十项最具发展潜力的机器人技术

柔性材料具有能在大范围内任意改变自身形状的特点,在管道故障检查、医疗诊断、侦查探测领域具有广泛应用前景。

机器学习中数据不平衡问题

可以把问题根据难度从小到大排个序:大数据+分布均衡<大数据+分布不均衡<小数据+数据均衡<小数据+数据不均衡。

说明:对于小数据集,机器学习的方法是比较棘手的。对于需要解决的问题,拿到数据后,首先统计可用训练数据有多大,然后再观察数据分布情况。经验表明,训练数据中每个类别有5000个以上样本,其实也要相对于特征而言,来判断样本数目是不是足够,数据量是足够的,正负样本差一个数量级以内是可以接受的,不太需要考虑数据不平衡问题(完全是经验,没有理论依据,仅供参考)。

0、搜集更多的数据

然而实际上,当搜集数据的代价不大时,这种方法是最有效的。

但是需要注意,当搜集数据的场景本来产生数据的比例就是不平衡时,这种方法并不能解决数据比例不平衡问题。

1、采样

采样分为上采样(Oversampling)和下采样(Undersampling),上采样是把小众类复制多份,下采样是从大众类中剔除一些样本,或者说只从大众类中选取部分样本。

哪三大趋势引领着物联网的未来?

虽然经历的多年的发展,物联网却仍然面临应用碎片化的挑战。在可以预见的未来,物联网更多地会倾向于率先在垂直行业里蓬勃发展,此外还有三种趋势值得关注。

(1)更加丰富的连接技术

物联网的基础是连接,任何物联网应用的底层都是通过网络进行连接。大家比较熟悉的连接技术包括WIFI、蓝牙、ZigBee等短距离无线连接技术和GPRS、LTE、NB-IoT等蜂窝连接技术,当然还包含了工业总线、以太网、PON等有线连接技术。

现在最受市场广泛关注的当属NB-IoT。随着2016年6月NB-IoT标准协议的冻结,NB-IoT着实又掀起了物联网市场新一波热潮。NB-IoT作为窄带蜂窝低功耗广域技术,其广覆盖、大连接、低功耗、低成本的优势,非常适合那些远距离传输、数据量少、需电池供电长久运行的物联网应用。

在实际场景中,大部分物联网应用通常只需要传输很少量的数据。例如,对于桥梁的位移状态数据进行采集,虽然数据量并不大,但桥梁一般位置比较分散,而且一般都不具备供电环境,传统的2G/3G通信对功耗要求较高而不能应用部署。NB-IoT的出现,将能够更有效地解决更多类似场景的接入需求。

AI热潮的关键:深度学习不止深度神经网络

【编者按】作为本轮AI的关键技术,深度学习不单只是深度神经网络模型本身。事实上,深度神经网络的发展痛点频频,包括稳定性和对设备的依赖性,以及调试复杂度困难等等。事实上,回归到深度学习的本质问题,前企学研界还有很多探索深度学习新的可能性。

本文原载于21世纪经济报,经亿欧网编辑,以供业内人士参考。

作为本轮人工智能热潮的关键技术,机器学习尤其是深度学习受到了热捧。一时间,人人嘴上挂着深度学习、神经网络等词汇,似乎不谈这一话题,便与智能时代脱节。

然而,无论开发者或科技企业,对深度学习恐怕存在一定误解。“如果问一下‘什么是深度学习’,绝大多数人的答案都会是:深度学习就是深度神经网络,甚至认为‘深度学习’就是‘深度神经网络’的同义词。”在2018英特尔人工智能大会上,南京大学计算机系主任、人工智能学院院长周志华直言现状。

这一观念其实是片面的。事实上,当前深度学习主流的深度神经网络模型本身,也存在着诸多问题。“吃数据,吃机器,对开发者门槛要求高。”当谈及当前模型痛点时,一位深度学习领域相关开发者向记者直言。另一位开发者则告诉记者,深度神经网络模型的效果稳定性也可能不如预期。

术语解析:OpenCL、OpenGL、OpenAL

一、OpenCL

(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。

OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。OpenCL由一门用于编写kernels (在OpenCL设备上运行的函数)的语言(基于C99)和一组用于定义并控制平台的API组成。OpenCL提供了基于任务分割和数据分割的并行计算机制。

OpenCL类似于另外两个开放的工业标准OpenGL和OpenAL,这两个标准分别用于三维图形和计算机音频方面。OpenCL扩展了GPU用于图形生成之外的能力。OpenCL由非盈利性技术组织Khronos Group掌管。