机器学习

适合入门的8个趣味机器学习项目

谈到机器学习,相信很多除学者都是通过斯坦福大学吴恩达老师的公开课《Machine Learning》开始具体的接触机器学习这个领域,但是学完之后又不知道自己的掌握情况,缺少一些实际的项目操作。对于机器学习的相关竞赛挑战,有些项目的门槛有些高,参加后难以具体的实现,因此造成自己对机器学习的热情逐渐衰减。大部分都经历过这个过程,一直想找一些练手的项目,最典型的练手项目比如手写体识别等,但这类的项目成熟得不能再成熟了,参考别人的网络模型跑一下实验,结果的准确率都快达到100%,学习调参的机会比较少,因此都想找一些适合初学者的项目练手。下面将给大家带来8个适合初学者学习的有趣的机器学习项目。

将自己的时间花在项目上是最好的一种投资方式,在项目中你会享受学习、保持积极性并取得更快的进展。没有任何理论可以代替实践,虽然教材和课程能让你掌握一些基本原理,但在尝试应用时,你会发现具体操作起来比较困难。因此项目有助于提高应用机器学习的技巧,此外在找工作中也会给自己增添一些筹码。

以下将具体介绍这8个项目,其中的任何一个项目都能在一个周末完成,如果你喜欢的话,可以对其进行相关的扩展。

1.机器学习的角斗士

有关机器学习每个人都应该了解的东西

摘要:本文科普了机器学习方面的知识,简单介绍了机器学习可以做什么,以及如何做的。以下是译文。

在过去的几个月中,我与很多的决策者交流了有关人工智能特别是机器学习方面的问题。其中有几名高管已经被投资者询问了有关他们在机器学习(Machine Learning)方面的战略,以及在哪些方面运用了机器学习。那么这个技术课题为什么突然会成为公司董事会讨论的话题呢?

计算机应该为人类解决问题。传统的方法是“编写”所需的程序,换句话说,就是我们教电脑问题解决的算法。该算法详细描述了解决问题的过程,就像食谱一样。很多任务都可以用算法来描述。例如,在小学里,我们学习了数字加法算法。当涉及到要快速、完美地运行这种算法时,计算机比人类更胜任这个工作。

有关机器学习每个人都应该了解的东西

大话人工智能:机器学习的优与劣

从 20 世纪 60 年代开始,人们就在期待像哈尔(HAL)这样的科幻级别的 AI,然而直到最近,PC 和机器人还是非常愚笨。现在,科技巨头和创业公司宣告了 AI 革命的到来:无人驾驶汽车、机器人医生、机器投资者等等。普华永道认为,到 2030 年,AI 将会向世界经济贡献 15.7 万亿美元。“AI”是 2017 年的热词,就像“.com”是 1999 年的时髦用语那样,每一个人都宣称自己对 AI 感兴趣。不要被有关 AI 的炒作所迷惑,它是泡沫还是真实?和旧有的 AI 潮流相比,它现在有什么新颖之处?

AI 并不会轻易或迅速地被应用。最令人兴奋的 AI 实例往往来自大学或者科技巨头。任何许诺用最新的 AI 技术让公司发生革命性变革的自封的 AI 专家,都只是在传递错误的 AI 信息,其中某些人只是重塑旧有技术的形象,把它们包装成 AI。每个人都已经通过使用 Google、微软、亚马逊的服务,来体验了最新的 AI 技术。但是,“深度学习”不会迅速地被大企业所掌握,用来定制内部项目。大多数人都缺乏足够的相关数字数据,不足以可靠地用来训练 AI。结果就是,AI 并不会杀死所有的工作机会,尤其因为它在训练和测试每个 AI 的时候还是需要人类。

解析阻止机器学习的十种网络攻击

即使是瑟曦.兰尼斯特的阴谋诡计或者乔拉.莫尔蒙爵士父亲般的保护(译注:两者都是HBO剧集《权力的游戏》中的人物)也无法阻止攻击者攻破HBO的网络并窃取了1.5TB的数据(包括未播出的《权力的游戏》剧集)。然而,机器学习可能已经为HBO的虚拟要塞提供了更好的防护。

人工智能(AI)和机器学习(ML)是众多辩论的主题,特别是在网络安全社区内更是如此。那么,机器学习会是下一个大的安全趋势吗?人工智能准备好了接受机器学习推动的攻击吗?总的来说,人工智能是否做好了使用的准备?无论你对于机器学习是否会成为网络安全救世主的看法如何,有两件事情却是真实的:一是分析在安全领域占有一席之地,二是机器学习在一些具体的使用案例中代表了我们今天所能给出的最好答案。

尽管有报道称黑客使用了”复杂老道”的入侵方法,但是很有可能的是黑客或黑客团体聪明地使用了常见的攻击方法攻入了这家银幕巨头的系统,并使用了 “little.finger66″(译注:”小指头66″,”小指头”是《权力的游戏》剧集人物培提尔.贝里席的绰号)这个绰号。

下面列举了一些使用案例,它们代表了一些会影响每一家企业的常见安全威胁。不过,机器学习可能是也可能不是网络安全的灵丹妙药,但在下面这些情况中,它肯定会有所帮助。

机器学习新手工程师常犯的6大错误

作者:李亚洲

理所当然地使用默认损失函数

在刚入门的时候,均方误差作为损失函数是很好的默认选择。但是当需要处理现实问题的时候,这种未经专门设计的损失函数很少能给出最优解。

拿欺诈检测为例。为了与你真正的商业目标一致,需要按照欺诈造成的损失美元金额的比例惩罚假负类。使用均方误差能给你一个还不错的结果,但不会是当前最佳的结果。

要点:每一次都自定义损失函数,使之紧密匹配你的目标。

对所有问题都使用一种算法/方法

很多人一旦完成了入门教程之后,就开始在所有的案例中都使用同一种算法。这很常见,他们觉得这种算法的效果和其它算法是一样的。这种假设是很糟糕的,最终会带来很差的结果。

解决办法是让数据为你选择模型。当你把数据预处理之后,将其馈送到多个不同的模型中去,看看结果如何。你将会了解哪些模型最适用,而哪些模型并不适合。

要点:如果你一直使用同一种算法,这可能意味着你的结果并不是最好的。

忽略异常值

不知道这些AI知识,千万别说你是AI圈的!

为什么人工智能,机器学习突然之间成了热门话题,变成IT领域,甚至其他领域的人们都在讨论的热点?也许文章的作者会给你一点这方面的思考。

最近,我有幸与人工智能领域相关企业的决策者进行交谈。 其中几名高管已经被投资者询问了他们的机器学习方向的战略,以及他们现有机器学习项目的情况。 那么为何机器学习会突然成为公司董事会讨论的话题呢?

大家都知道,从一开始计算机就被设计成帮助人类解决各种问题。 传统的软件工程就是针对某个问题进行编程。换句话说,就是我们告诉计算机一个能解决某个问题的算法,并让它来执行。现实世界中很多问题可以被描述成某个算法。 比如,小学算数中,我们用加法来解决计数问题。一旦现实问题被抽象成了算法,计算机能比人类更快速,更高效地执行它们。

不过,人们也渐渐的发现了这种过程的局限性。对于类似图像识别这类问题(例如,判断照片中是否是一只猫),在人类看来是如此的轻而易举,然而想把这类问题描述成一种高效的算法却并不容易。由于对象的特征有可能被隐藏起来,我们不能简单的用“有四条腿”或“有两只眼睛”来对判断是否是猫的照片。而且,照片中还可能只显示了猫的一部分,问题就演变为识别猫的某个部位,进而使得问题变得愈加复杂。

机器学习将是物联网发展不可或缺的未来式

近几年来,几乎没有什么像机器学习那样能够推动物联网大幅增长,无论是激发人类的创造力,超越人类的效率,还是为更新的技术突破和重塑物联网铺平道路,机器学习无疑是推动物联网进入 21 世纪的超级燃料。那么机器学习的三大方式是什么,又将如何推动物联网的发展呢 ?

使数据有用

物联网会产生庞大的数据,这是它的特征之一。即使如此,但如果企业和个人无法使用这些数据,那它们都是完全没用的。那么市场究竟如何利用这个有价值的数据呢 ? 通过机器学习。

如今的机器学习算法通过梳理数据集这种方式,而人类没办法做到这一点。据估计,物联网的持续增长,到了 2021 年,它可能达到价值 1.6 亿美元的高点,这就意味着会需要更多的算法来跟上相应的数据上涨。

正如 ABI 研究所指出的,机器学习的最新进展使其能够进行预测分析,这意味着采用这些算法的企业可以更好地预测未来的市场趋势,并更成功地瞄准未来的客户。

使物联网更安全

机器学习不仅仅是由企业或创新者所使用,它也用于安全目的,目前已有机器学习算法正在应对网络威胁。

未来 3~5 年,哪个方向的机器学习人才最紧缺?

既然已经身在工业界,那么我就谈谈工业界未来几年需要什么样的机器学习人才。不谈学术界主要还是因为大部分人最终不会从事研究,而会奋斗在应用领域。相较而言,工业界对人才的需求更加保守,这和学术界不同。这受限于很多客观因素,如硬件运算能力、数据安全、算法稳定性、人力成本开支等。

这个答案可能更适合两类人:
1. 在读的学生朋友
2. 工作不久想要转行机器学习的朋友。
特别厉害的技术大牛建议探索适合自己的路线,而我只能谈一谈适合大部分人的路线。但在回答前,我还是忍不住吐槽一下那种简单回答“深度学习”,“大数据”,“NLP”,“机器视觉”的人。这每一个领域的小方向都多如牛毛,以自然语言处理(NLP)为例,细分有自然语言生成、自然语言理解,还有不同语言的语言模型。任何一个方向花几十年研究也不为过,只给出几个字的答案和买彩票有什么区别…

因此大部分机器学习实践者还是该脚踏实地。盲目追逐热点很容易跌进陷阱,而巩固基础、寻找自己擅长的领域和机器学习交叉点可以帮助你在未来的就业市场变得炙手可热,成为工业界最紧缺的人才。

0. 背景

推荐:有助于你掌握机器学习的十三个框架

作者:Serdar Yegulalp

在过去的一年里,机器学习炙手可热。机器学习的“突然”降临,并不单纯因为廉价的云环境和更强有力的GPU硬件。也因为开放源码框架的爆炸式增长,这些框架将机器学习中最难的部分抽象出来,并将这项技术提供给更广大范围的开发者。

这里有新鲜出炉的机器学习框架,既有初次露面的,也有重新修改过的。这些工具被大众所注意,或是因为其出处,或是因为以新颖的简单方法处理问题,或是解决了机器学习中的某个特定难题,或者是上述的所有原因。

有助于你掌握机器学习的十三个框架

1、Apache Spark MLlib

人工智能、机器学习和深度学习的区别是什么?

我们周围的事物正变得越来越智能。

从汽车到智能手机,到数字助理,甚至包括机器人。我们不只是在讲每天层出不穷的、突破性的新功能。更重要的是,设备、计算机和机器都在聪明地执行任务。它们是如何做到的呢?通过人工智能,也就是AI。

“人工智能”一词最早由认知科学家约翰·麦卡锡在研究中提出,他写到,“这项研究基于一种推测,即任何学习行为或其它智力特征,在原则上都可以被精确地描述,从而可以制造出一台机器来模拟它。”这种描述在今天仍然适用,只是复杂性增加了一些。

人工智能、机器学习和深度学习的区别是什么?

你也许最近经常听到“人工智能”和另外几个词汇同时出现,特别是“机器学习”和“深度学习”。它们经常被互换使用,尽管它们存在关联,但其实并非同一事物。

这样说可能会让人感到困惑。我们通过一个经典的例子来解释人工智能、机器学习和深度学习之间的区别:比较苹果和橙子。

人工智能

同步内容
--电子创新网--
粤ICP备12070055号