机器学习

解析阻止机器学习的十种网络攻击

即使是瑟曦.兰尼斯特的阴谋诡计或者乔拉.莫尔蒙爵士父亲般的保护(译注:两者都是HBO剧集《权力的游戏》中的人物)也无法阻止攻击者攻破HBO的网络并窃取了1.5TB的数据(包括未播出的《权力的游戏》剧集)。然而,机器学习可能已经为HBO的虚拟要塞提供了更好的防护。

人工智能(AI)和机器学习(ML)是众多辩论的主题,特别是在网络安全社区内更是如此。那么,机器学习会是下一个大的安全趋势吗?人工智能准备好了接受机器学习推动的攻击吗?总的来说,人工智能是否做好了使用的准备?无论你对于机器学习是否会成为网络安全救世主的看法如何,有两件事情却是真实的:一是分析在安全领域占有一席之地,二是机器学习在一些具体的使用案例中代表了我们今天所能给出的最好答案。

尽管有报道称黑客使用了”复杂老道”的入侵方法,但是很有可能的是黑客或黑客团体聪明地使用了常见的攻击方法攻入了这家银幕巨头的系统,并使用了 “little.finger66″(译注:”小指头66″,”小指头”是《权力的游戏》剧集人物培提尔.贝里席的绰号)这个绰号。

下面列举了一些使用案例,它们代表了一些会影响每一家企业的常见安全威胁。不过,机器学习可能是也可能不是网络安全的灵丹妙药,但在下面这些情况中,它肯定会有所帮助。

机器学习新手工程师常犯的6大错误

作者:李亚洲

理所当然地使用默认损失函数

在刚入门的时候,均方误差作为损失函数是很好的默认选择。但是当需要处理现实问题的时候,这种未经专门设计的损失函数很少能给出最优解。

拿欺诈检测为例。为了与你真正的商业目标一致,需要按照欺诈造成的损失美元金额的比例惩罚假负类。使用均方误差能给你一个还不错的结果,但不会是当前最佳的结果。

要点:每一次都自定义损失函数,使之紧密匹配你的目标。

对所有问题都使用一种算法/方法

很多人一旦完成了入门教程之后,就开始在所有的案例中都使用同一种算法。这很常见,他们觉得这种算法的效果和其它算法是一样的。这种假设是很糟糕的,最终会带来很差的结果。

解决办法是让数据为你选择模型。当你把数据预处理之后,将其馈送到多个不同的模型中去,看看结果如何。你将会了解哪些模型最适用,而哪些模型并不适合。

要点:如果你一直使用同一种算法,这可能意味着你的结果并不是最好的。

忽略异常值

不知道这些AI知识,千万别说你是AI圈的!

为什么人工智能,机器学习突然之间成了热门话题,变成IT领域,甚至其他领域的人们都在讨论的热点?也许文章的作者会给你一点这方面的思考。

最近,我有幸与人工智能领域相关企业的决策者进行交谈。 其中几名高管已经被投资者询问了他们的机器学习方向的战略,以及他们现有机器学习项目的情况。 那么为何机器学习会突然成为公司董事会讨论的话题呢?

大家都知道,从一开始计算机就被设计成帮助人类解决各种问题。 传统的软件工程就是针对某个问题进行编程。换句话说,就是我们告诉计算机一个能解决某个问题的算法,并让它来执行。现实世界中很多问题可以被描述成某个算法。 比如,小学算数中,我们用加法来解决计数问题。一旦现实问题被抽象成了算法,计算机能比人类更快速,更高效地执行它们。

不过,人们也渐渐的发现了这种过程的局限性。对于类似图像识别这类问题(例如,判断照片中是否是一只猫),在人类看来是如此的轻而易举,然而想把这类问题描述成一种高效的算法却并不容易。由于对象的特征有可能被隐藏起来,我们不能简单的用“有四条腿”或“有两只眼睛”来对判断是否是猫的照片。而且,照片中还可能只显示了猫的一部分,问题就演变为识别猫的某个部位,进而使得问题变得愈加复杂。

机器学习将是物联网发展不可或缺的未来式

近几年来,几乎没有什么像机器学习那样能够推动物联网大幅增长,无论是激发人类的创造力,超越人类的效率,还是为更新的技术突破和重塑物联网铺平道路,机器学习无疑是推动物联网进入 21 世纪的超级燃料。那么机器学习的三大方式是什么,又将如何推动物联网的发展呢 ?

使数据有用

物联网会产生庞大的数据,这是它的特征之一。即使如此,但如果企业和个人无法使用这些数据,那它们都是完全没用的。那么市场究竟如何利用这个有价值的数据呢 ? 通过机器学习。

如今的机器学习算法通过梳理数据集这种方式,而人类没办法做到这一点。据估计,物联网的持续增长,到了 2021 年,它可能达到价值 1.6 亿美元的高点,这就意味着会需要更多的算法来跟上相应的数据上涨。

正如 ABI 研究所指出的,机器学习的最新进展使其能够进行预测分析,这意味着采用这些算法的企业可以更好地预测未来的市场趋势,并更成功地瞄准未来的客户。

使物联网更安全

机器学习不仅仅是由企业或创新者所使用,它也用于安全目的,目前已有机器学习算法正在应对网络威胁。

未来 3~5 年,哪个方向的机器学习人才最紧缺?

既然已经身在工业界,那么我就谈谈工业界未来几年需要什么样的机器学习人才。不谈学术界主要还是因为大部分人最终不会从事研究,而会奋斗在应用领域。相较而言,工业界对人才的需求更加保守,这和学术界不同。这受限于很多客观因素,如硬件运算能力、数据安全、算法稳定性、人力成本开支等。

这个答案可能更适合两类人:
1. 在读的学生朋友
2. 工作不久想要转行机器学习的朋友。
特别厉害的技术大牛建议探索适合自己的路线,而我只能谈一谈适合大部分人的路线。但在回答前,我还是忍不住吐槽一下那种简单回答“深度学习”,“大数据”,“NLP”,“机器视觉”的人。这每一个领域的小方向都多如牛毛,以自然语言处理(NLP)为例,细分有自然语言生成、自然语言理解,还有不同语言的语言模型。任何一个方向花几十年研究也不为过,只给出几个字的答案和买彩票有什么区别…

因此大部分机器学习实践者还是该脚踏实地。盲目追逐热点很容易跌进陷阱,而巩固基础、寻找自己擅长的领域和机器学习交叉点可以帮助你在未来的就业市场变得炙手可热,成为工业界最紧缺的人才。

0. 背景

推荐:有助于你掌握机器学习的十三个框架

作者:Serdar Yegulalp

在过去的一年里,机器学习炙手可热。机器学习的“突然”降临,并不单纯因为廉价的云环境和更强有力的GPU硬件。也因为开放源码框架的爆炸式增长,这些框架将机器学习中最难的部分抽象出来,并将这项技术提供给更广大范围的开发者。

这里有新鲜出炉的机器学习框架,既有初次露面的,也有重新修改过的。这些工具被大众所注意,或是因为其出处,或是因为以新颖的简单方法处理问题,或是解决了机器学习中的某个特定难题,或者是上述的所有原因。

有助于你掌握机器学习的十三个框架

1、Apache Spark MLlib

人工智能、机器学习和深度学习的区别是什么?

我们周围的事物正变得越来越智能。

从汽车到智能手机,到数字助理,甚至包括机器人。我们不只是在讲每天层出不穷的、突破性的新功能。更重要的是,设备、计算机和机器都在聪明地执行任务。它们是如何做到的呢?通过人工智能,也就是AI。

“人工智能”一词最早由认知科学家约翰·麦卡锡在研究中提出,他写到,“这项研究基于一种推测,即任何学习行为或其它智力特征,在原则上都可以被精确地描述,从而可以制造出一台机器来模拟它。”这种描述在今天仍然适用,只是复杂性增加了一些。

人工智能、机器学习和深度学习的区别是什么?

你也许最近经常听到“人工智能”和另外几个词汇同时出现,特别是“机器学习”和“深度学习”。它们经常被互换使用,尽管它们存在关联,但其实并非同一事物。

这样说可能会让人感到困惑。我们通过一个经典的例子来解释人工智能、机器学习和深度学习之间的区别:比较苹果和橙子。

人工智能

机器学习在IT运维中的应用

IT 运维中,机器学习是什么?

现如今,人工智能和机器学习已经渗透进了每个领域,它从根本上改变和影响了这些领域的业务模式、技术架构以及方法论。同样在 IT 运维与 Devops 中也是如此。作为 IT 运维团队,我们真正关注的是机器学习如何提供实时事件的管理能力,从而帮助较大规模的企业提高服务质量。这其中的关键点就在于在用户发现问题之前提早探测异常,进而减少生产事故与中断带来的负面影响。

那么在 IT 运维中,机器学习是什么?

在 wiki 中机器学习的定义如下:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

也就是说,随着任务的不断执行,经验的积累会带来计算机性能的提升。

和传统模式说再见,看机器学习如何走向深度学习?

作者:小鲸

主流的科技公司已在积极地把自己定位成AI或者机器学习公司:谷歌把“AI先行”作为公司战略,Uber自带机器学习的血统,而各种AI研究实验室更是层出不穷。

这些公司都在想尽办法说服世界,“机器智能的革命时代正在到来”。它们尤其强调深度学习,因为这些都在推动自驾汽车、虚拟助手等概念的发展。

尽管现在这些概念很流行,然而当下的实践却没那么乐观。

现在,软件工程师和数据科学家仍在使用许多几年前的算法和工具。

这也意味着,传统的机器学习模式仍在支撑着大多数AI的应用,而不是深度神经网络。工程师仍然用传统工具来处理机器学习,但是这并不起作用:采用数据建模的流水线最终由零散、不兼容的片段构成。这种情况在逐渐变化,因为大型科技公司正在研发具有端到端功能的特定机器学习平台。

和传统模式说再见,看机器学习如何走向深度学习?

机器学习“三明治”中夹了什么?

关于机器学习你必须了解的十个真相

作为一个经常向非专业人士解释机器学习的人,我整理了以下十点内容作为对机器学习的一些解释说明。

1、机器学习意味着从数据中学习;而AI则是一个时髦的词。机器学习并不像天花乱坠的宣传那样:通过向适当的学习算法提供适当的训练数据,你可以解决无数的难题。把它称之为AI吧,如果这有助于销售你的AI系统的话。但你要知道,AI只是一个时髦的词,这只代表了人们对它的期望而已。

2、机器学习主要涉及到数据和算法,但最主要的还是数据。机器学习算法特别是深度学习的进步,有很多令人兴奋的地方。但数据是使机器学习成为可能的关键因素。机器学习可以没有复杂的算法,但不能没有好的数据。

3、除非你有大量的数据,否则你应该坚持使用简单的模型。机器学习根据数据中的模式来训练模型,探索由参数定义的可能模型的空间。如果参数空间太大,就会对训练数据过度拟合,并训练出一个不能使自己一般化的模型。如果要对此做详细解释的话,需要进行更多的数学计算,而你应该把这一点当作为一个准则,让你的模型尽可能得简单。

同步内容
--电子创新网--
粤ICP备12070055号