【译】看清机器学习的真面目

原文:Get Over With the Machine Learning Hype
作者:sapySaptarshi Chatterjee
译者:如意同学

译者小声bb:

原作者表达了对机器学习强烈的嗤之以鼻,甚至还使用了一些奇怪的词汇(大雾)。

不过撇开原文极端的个人态度,文章对机器学习的总结还是很到位的,本文是原文的部分翻译,截取了其中个人认为有价值的部分,基本保留了原文的观点,但是去除了比较激烈的言辞,总体上还是有利于大家对机器学习有一个更加系统的认识:机器学习很强大,但也并不是无所不能。对原文观点有兴趣的,可以前往原文链接。

原文如下

现在是2019年9月26日。好像现在的每一场技术讨论,如果一个人想让自己听上去很酷,就会说出“机器学习”这个词,期待着能够征服这场讨论。

我就是其中之一。我想让我的生活更精彩,所以放弃了高薪职业,转而去攻读机器学习硕士学位。我对这个决定并不后悔,但是我却发现机器学习非常令人失望,所以最终我改变了我专业方向。

当你在完全理解机器学习的那一天,你对于机器学习的幻想就会随之结束。根本就没有任何机器学会了任何事情。把这个领域称为“机器学习”真是一件神奇的事情。

你可能听说过,机器学习可以治愈癌症,可以开车,可以代替人类自己写代码等等等等。记住我的话——这些都是是辣鸡

截止2019年9月,机器学习主要只做了4件事。

1. 回归任务

给定一组数据,当有新的数据行被加入时,机器学习可以预测,这个新加入行的某些缺失值的可能值。

a b 2
b c 3
x d ?

2. 分类任务(监督学习)

给定一系列的对象和一系列的分类,我们已经知道哪些对象属于哪些分类。机器学习可以预测,一个未知类别的新元素,它是属于这一系列分类里的哪一类。

例如,奥迪和宝马属于“汽车”类别,波音和空中客车属于“飞机”类别,如果我现在给出了泰坦尼克号,机器学习有很大概率会把它分类为“飞机”,因为泰坦尼克号的重量,高度,成本等更像是一座飞机。可是机器学习永远无法判断它实际上是一艘船,因为我们最初给出的分类里没有一个叫做船的东西

3. 非监督学习(通常也用于分类)

给定一系列的对象,和想要分类的数量n。机器学习可以把类似的对象分为到一组,一共分为n类。

再例如。我现在要把奥迪,宝马,波音,空客以及泰坦尼克号进行分类,现在我告诉神经网络有2个分类集。他很有可能会预测奥迪和宝马属于一类,空客,波音,泰坦尼克号属于第二类。但是,它不能说出第一类和第二类实际上指的是什么,需要人指着他们说——嘿,这是汽车。当然我也可以告诉它我们要分为三类,泰坦尼克号很可能会被分到第三类,因为它的特征与其他物体完全不同,但是,机器学习永远不会告诉你,它是一条船。

4. 强化学习

如果你的问题有一个最终目标(像是赢得下棋比赛),你可以设法为每一个可能的步数设置分数,像是“好棋”和“坏棋”,好棋分配奖励点数,坏棋分配惩罚。那么你设计出了一个系统,它可以让你用最大的可能性赢得比赛。(至于如何判断好棋还是坏棋, 那就是算法上的事情了,和机器学习的本身没有什么关系)

以上可以说是目前机器学习的全部了。

那既然如此,人们说他可以帮助我们实现自动驾驶,或者检测癌症呢?

你可以在几千条人类的健康情况数据中,标记出某个病人患有癌症,或者某个病人是健康的。现在,如果给出了一个新的病人记录,那么我们就可以使用分类算法来预测它是属于癌症组或健康组。

或者,我们把驾驶汽车的任务分解成数千个子步骤,比如向右移动,向右移动,结合道路状况,机器学习就可以预测汽车下一步应该采取什么步骤。你可能想到了,和机器学习相比,这个任务更需要的是电子和机械工程方面的创新。

机器学习只是一台计算机执行一些算法,并提供一些输出,在任何时候,它都不能控制我们或者统治世界。

机器学习是计算机的算法,离散数学,和概率论的结合。如果我们把大量的数据喂给它进行计算,他可以给出一些模拟真实世界的概率值。但是,认为它会改变世界的假设,实在是太夸大其词了。

来源:掘金
原文链接:https://juejin.im/post/5dbb9faa518825211d73fe21
转载此文目的在于传递更多信息,版权归原作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。

最新文章