【译】看清机器学习的真面目

joycha 在周一, 11/04/2019 - 18:04 提交

原文：Get Over With the Machine Learning Hype
作者：sapySaptarshi Chatterjee
译者：如意同学

译者小声bb：

原作者表达了对机器学习强烈的嗤之以鼻，甚至还使用了一些奇怪的词汇（大雾）。

不过撇开原文极端的个人态度，文章对机器学习的总结还是很到位的，本文是原文的部分翻译，截取了其中个人认为有价值的部分，基本保留了原文的观点，但是去除了比较激烈的言辞，总体上还是有利于大家对机器学习有一个更加系统的认识：机器学习很强大，但也并不是无所不能。对原文观点有兴趣的，可以前往原文链接。

原文如下

现在是2019年9月26日。好像现在的每一场技术讨论，如果一个人想让自己听上去很酷，就会说出“机器学习”这个词，期待着能够征服这场讨论。

我就是其中之一。我想让我的生活更精彩，所以放弃了高薪职业，转而去攻读机器学习硕士学位。我对这个决定并不后悔，但是我却发现机器学习非常令人失望，所以最终我改变了我专业方向。

当你在完全理解机器学习的那一天，你对于机器学习的幻想就会随之结束。根本就没有任何机器学会了任何事情。把这个领域称为“机器学习”真是一件神奇的事情。

你可能听说过，机器学习可以治愈癌症，可以开车，可以代替人类自己写代码等等等等。记住我的话——这些都是是辣鸡

截止2019年9月，机器学习主要只做了4件事。

1. 回归任务

给定一组数据，当有新的数据行被加入时，机器学习可以预测，这个新加入行的某些缺失值的可能值。

a b 2
b c 3
x d ?

2. 分类任务（监督学习)

给定一系列的对象和一系列的分类，我们已经知道哪些对象属于哪些分类。机器学习可以预测，一个未知类别的新元素，它是属于这一系列分类里的哪一类。

例如，奥迪和宝马属于“汽车”类别，波音和空中客车属于“飞机”类别，如果我现在给出了泰坦尼克号，机器学习有很大概率会把它分类为“飞机”，因为泰坦尼克号的重量，高度，成本等更像是一座飞机。可是机器学习永远无法判断它实际上是一艘船，因为我们最初给出的分类里没有一个叫做船的东西

3. 非监督学习（通常也用于分类）

给定一系列的对象，和想要分类的数量n。机器学习可以把类似的对象分为到一组，一共分为n类。

再例如。我现在要把奥迪，宝马，波音，空客以及泰坦尼克号进行分类，现在我告诉神经网络有2个分类集。他很有可能会预测奥迪和宝马属于一类，空客，波音，泰坦尼克号属于第二类。但是，它不能说出第一类和第二类实际上指的是什么，需要人指着他们说——嘿，这是汽车。当然我也可以告诉它我们要分为三类，泰坦尼克号很可能会被分到第三类，因为它的特征与其他物体完全不同，但是，机器学习永远不会告诉你，它是一条船。

4. 强化学习

如果你的问题有一个最终目标（像是赢得下棋比赛），你可以设法为每一个可能的步数设置分数，像是“好棋”和“坏棋”，好棋分配奖励点数，坏棋分配惩罚。那么你设计出了一个系统，它可以让你用最大的可能性赢得比赛。（至于如何判断好棋还是坏棋，那就是算法上的事情了，和机器学习的本身没有什么关系）

以上可以说是目前机器学习的全部了。

那既然如此，人们说他可以帮助我们实现自动驾驶，或者检测癌症呢？

你可以在几千条人类的健康情况数据中，标记出某个病人患有癌症，或者某个病人是健康的。现在，如果给出了一个新的病人记录，那么我们就可以使用分类算法来预测它是属于癌症组或健康组。

或者，我们把驾驶汽车的任务分解成数千个子步骤，比如向右移动，向右移动，结合道路状况，机器学习就可以预测汽车下一步应该采取什么步骤。你可能想到了，和机器学习相比，这个任务更需要的是电子和机械工程方面的创新。

机器学习只是一台计算机执行一些算法，并提供一些输出，在任何时候，它都不能控制我们或者统治世界。

机器学习是计算机的算法，离散数学，和概率论的结合。如果我们把大量的数据喂给它进行计算，他可以给出一些模拟真实世界的概率值。但是，认为它会改变世界的假设，实在是太夸大其词了。

来源：掘金
原文链接：https://juejin.im/post/5dbb9faa518825211d73fe21
转载此文目的在于传递更多信息，版权归原作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。

机器学习

8个常见的机器学习算法的计算复杂度总结	机器学习模型评估方法	2022年必须要了解的20个开源NLP 库
【机器学习】解决过拟合的几种方法（Overfitting Solutions）	网络安全中的机器学习：挑战与比较	机器学习-决策树

最新文章

最新文章