demi的博客

新手如何开始学深度学习?别着急,看看别人走过的路先

作者:Arkar Min Aung
编译:ronghuaiyang

新手如何开始学深度学习,这个问题很难回答,每个人似乎都有自己的一套方法,在开始之前,先看看别人是怎么做的,也许会对自己有所启发。

刚开始学深度学习的时候,一定要像婴儿学步一样,慢慢的小步走。
很多人问我如何开始机器学习和深度学习。在这里,我整理了一个我使用过的资源列表,以及我第一次学习深度学习时所走过的路。

免费课程

2018最酷的黑客手法

这是恶意黑客胆大妄为的一年,某些手法此前根本想象不到——佯攻、加密货币劫持、社会工程和破坏性恶意软件行动。但即便是在2018年民族国家和网络犯罪攻击日渐猖獗的背景下,安全研究人员还是找到了一些以黑治黑预先制止坏人攻击的创新手法。

2018年,包括青少年在内的白帽子黑客攻入了一系列重要目标,比如机载卫星设备、美国大选仿真网站和吸尘机器人。他们还运用社会工程和网络钓鱼者自己的战术和人工智能(AI)挫败了坏人自己的阴谋,在漏洞被滥用之前抢先曝光。

我们不妨先忘了那些失败的比特币挖矿实验、家庭路由器中的俄罗斯黑客和网络上潜伏着的武器化PowerShell脚本,花几分钟时间回顾一下安全研究人员今年的创新黑客壮举。

1. 飞机上的黑客

虽然耗时四年,但 Ruben Santamarta 最终证明了他在2014年报告的卫星设备固件重大漏洞是可以被武器化的。这位IOActive的研究员从地面黑进了机上WiFi网络,暗中观察乘客的互联网活动,并侵入机载卫星通信设备,充分展示了他之前得出的漏洞利用理论的正确性,驳斥了当时某些专家的怀疑。

图形 API 规范 Vulkan 1.1.97 发布:新增5个扩展程序

Vulkan 1.1.97 已经发布,该版本主要新增了一些扩展程序,内容如下:

  •   VK_EXT_buffer_device_address - Provides a means to query a buffer device address value for a buffer. That value can then be used to access the buffer memory via PhysicalStorageBufferEXT in GLSL and SPV_EXT_physical_storage_buffer from SPIR-V.

  •   VK_EXT_memory_budget - This exposes the memory used and total memory budgeted for a memory heap. From there it can be estimated for how much total memory from each heap a process is using at a particular moment.

2019年人工智能领域预测与展望

2019年人工智能领域会出现怎样的演变呢?相比之前几年会有什么样的变化呢?

人工智能正主导着全球企业的创新——无论是大型企业集团还是年轻的初创企业。据市场研究报告《从技术和垂直行业看人工智能市场——全球机会分析和行业预测》称,2018年至2025年,全球人工智能市场规模预计将从2016年的40.65亿美元增长至1694.11亿美元,复合年增长率达到55.6%。该报告按技术、行业垂直和地区来划分人工智能市场。人工智能技术被细分为机器学习、自然语言处理、图像处理和语音识别。2016年,在营收方面,机器学习领域主导了人工智能市场,得益于人工智能行业解决方案的需求增加,预计未来几年这一趋势将会延续下去。根据Statista的数据,最大的营收部分来自面向企业应用程序市场的人工智能。

以下是对2019年人工智能领域的预测:

IBM、谷歌、微软、亚马逊以及机器学习API提供商将发布更具包容性的数据集,以应对人工智能内嵌的歧视和偏见问题

2019年物联网技术将与人工智能融为一体

物联网(IoT)是IT基础设施的下一个发展阶段,将是能够处理数百万台甚至数十亿物联网设备的承载大部分数据负载的边缘平台。

但是,这种规模和范围的数据生态系统不会一蹴而就。当人们进入2019年,物联网将在边缘计算方面如何发展?在未来一年将有什么样的发展?

虽然物联网如今开始产生大量数据,但目前的数据量在未来十年发展中可能微不足道。事实上,人们所看到和触摸的每件事物,甚至是自己身体的一部分,在不久的将来会生成连续的数据流,以处理和存储边缘上的元素和集中式数据设施。而在那里,它将被解析、分析、组合,或以其他方式操纵,而在理论上将让公众受益于物联网。

物联网的发展

根据Zebra科技公司的调查,在过去一年中,企业对于物联网基础设施的平均投资为460万美元,比2017年增加了4%。大约84%的企业希望在2021年完成物联网的部署,尽管这可能用语不当,因为物联网不可能完全发展成熟,可能永远也不会,就像现在的数据中心基础设施还在不断发展一样。最可能的情况是,物联网将在未来两年内达到足够成熟的发展阶段,开始对商业模式做出重大贡献。

揭示虚拟现实的5个误区

尽管虚拟现实(VR)技术受到了科技界的欢迎和广泛采用,但关于这项技术的错误信息导致了过度的谨慎,并因此减缓了其主流采用。

尽管近年来基于虚拟现实的新应用和业务出现得如此迅速,但大多数企业在采用这项技术时都持谨慎态度。鉴于主流社区普遍存在大量关于虚拟现实的不同观点和误区,因此这种不确定性是可以理解的。但是,一些企业已经意识到使用虚拟现实应用的价值,并且已经在绘制潜在的应用领域。旨在利用虚拟现实以获得竞争优势的企业必须首先将事实与误区分开,并了解该技术的真正含义。

以下是关于虚拟现实的五个误区:

1、虚拟现实仅仅适用于游戏和娱乐

虽然虚拟现实主要是作为一种体验游戏和电影的方式而被普及,但它可以为企业增加价值,并通过许多其他方式丰富人们的生活。从零售到医疗保健等各个行业的企业正在试验虚拟现实来解决问题和改进流程,在教育机构中使用虚拟现实技术仅仅只是增加价值和改进工作方式的案例之一。尽管虚拟现实在游戏和娱乐领域的潜力巨大,但它对其他行业的影响也不容小觑,甚至影响力可以超过游戏和娱乐领域。

OpenGL-渲染管线的流程(有图有真相)

学习shader之前必须知道的事情:shader(着色语言)到底发生在那个阶段?OpenGL的渲染管线有哪些阶段?这对开发人员来说很重要,也许你刚刚接触,或者你在使用已有的产品,很优秀的游戏引擎,或者渲染引擎,你觉得知道这个没有太大意义,但知道了这些,总归对你没有坏处。

下图是一个非常简化框图流水线的各个阶段,并在他们之间传播的数据。虽然极其简单,它是足够的着色器编程,提出了一些重要的概念。固定管线中存在很多阶段,并存在很多细节,这里只是粗略的介绍。

(1)顶点变换:

在这里,一个顶点的属性,如在空间的位置,以及它的颜色,法线,纹理坐标,其中包括一组。这个阶段的输入的各个顶点的属性。由固定的功能所执行的操作,主要完成一下工作:
1. 顶点位置变换
2. 计算顶点观照
3. 纹理坐标变换

(2)图元装配:

机器学习中在线学习、批量学习、迁移学习、主动学习的区别

一、批量学习

在监督学习的批量方法中,多层感知器的突出权值的调整在训练样本集合的所有N个例子都出现后进行,这构成了训练的一个回合。换句话说,批量学习的代价函数是由平均误差能量定义的。多层感知器的突触权值的调整是以回合-回合为基础的。相应地,学习曲线的一种实现方式是通过描绘平均误差能量对回合数的图形而得到,对于训练的每一个回合,训练样本集合的样例是随机选取的。学习曲线通过对足够大量的这样实现的总体平均来计算,这里每次实现是在随机选取不同初始条件下完成的。这一特点符合交叉验证的规律,实验中的实验集、验证集、测试集一般都是批量处理的典例。

优点:
(1)消除样本顺序的影响
(2)对梯度向量的精确估计,因此,在简单条件下,保证了这一方法最速下降到局部极小点的收敛性。
(3)学习的并行性。

缺点:
(1)有着存储需求

二、在线学习

为何GPU可以用于加速人工智能或者机器学习的计算速度?

一、Why GPU

其实GPU计算比CPU并不是“效果好”,而是“速度快”。

计算就是计算,数学上都是一样的,1+1用什么算都是2,CPU算神经网络也是可以的,算出来的神经网络放到实际应用中效果也很好,只不过速度会很慢罢了。

GPU的起源

GPU全称叫做graphics processing unit,图形处理器,顾名思义就是处理图形的。

电脑显示器上显示的图像,在显示在显示器上之前,要经过一些列处理,这个过程有个专有的名词叫“渲染”。以前的计算机上没有GPU,渲染就是CPU负责的。渲染是个什么操作呢,其实就是做了一系列图形的计算,但这些计算往往非常耗时,占用了CPU的一大部分时间。而CPU还要处理计算机器许多其他任务。因此就专门针对图形处理的这些操作设计了一种处理器,也就是GPU。这样CPU就可以从繁重的图形计算中解脱出来。

由于GPU是专门为了渲染设计的,那么他也就只能做渲染的那些事情。

图像分割网络FCN原理详解

一、全卷积网络(FCN)

卷积神经网络从图像分类到到对象检测、实例分割、到图像语义分割、是卷积特征提取从粗糙输出到精炼输出的不断升级,基于卷积神经网络的全卷积分割网络FCN是像素级别的图像语义分割网络,相比以前传统的图像分割方法,基于卷积神经网络的分割更加的精准,适应性更强。

为了了解全卷积网络,我们必须他与普通CNN网络的区别:

1.1 CNN网络

通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量。以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务,因为它们最后都期望得到整个输入图像的一个数值描述(概率),比如AlexNet的ImageNet模型输出一个1000维的向量表示输入图像属于每一类的概率(softmax归一化)。

  •   举例:下图中的猫, 输入AlexNet, 得到一个长为1000的输出向量, 表示输入图像属于每一类的概率, 其中在“tabby cat”这一类统计概率最高(如下图)。