你绝对能懂的“机器学习”(三)

很多人对机器学习的边界范围似是而非,机器学习是人工智能吗?机器学习与大数据、云计算有什么关系?机器学习是不是就是数据挖掘?机器学习是不是就是算法,就是统计学?深度学习是不是机器学习的升级版?

还记得以前的中关村开会的例子吗:你住在北京南4环以外,明天周一早上9点需要在北4环的中关村开个会,你给计算机输入出发地点,开会时间和开会地点,计算机根据很长一段时间内周一到周日每个时间段北京各条道路的堵车指数数据,经过学习后,自动计算输出:几点几分出发。

看到这里,很多人就会说,这不就是“人工智能”吗!计算机学习过往的经验数据,自己判断、自己决策什么是最优的出发时间。那么它同时也是“深度学习”吗?

没错,这是人工智能(Artificial Intelligence, AI),但是不是“深度学习”现在还不好说,关于“深度学习”以后会再讲。这里要说明的是,人工智能是一个涵盖范围非常广的概念,或者说是一个非常宽泛的概念。

可以这样说:

深度学习属于机器学习,机器学习又属于人工智能。

画成图就是这样:


你可以这样理解:人工智能就如同是北京的房子,我们都知道北京的房子贵,也知道人工智能很高级,但都是宽泛的概念。北京的房子有学区房、商住房、两限房,经济适用房等,还要分区域,是东城区的房子还是丰台区的房子。我们只有围绕具体的环境、具体的应用谈论北京的房子才有意义,是门头沟区的经济适用房,还是海淀区的学区房。

因此:

如果把人工智能比作北京的房子,那机器学习就是北京的学区房,而深度学习就是学区房中的西城区学区房。

注:西城区是北京核心区,故宫和中南海所在地,北京最好的中小学都在西城区。

稍微拓展下话题。从上面的图中可以看出,我故意把机器学习占人工智能范围的比例画的比较大,而深度学习又占了机器学习非常大的比例,这不是没有缘由的。

事实上,人工智能领域近些年来突然热门起来,毫不客气的说是机器学习尤其是深度学习的发展而带动的。自上世纪50年代人工智能提出后,其发展就一直非常缓慢,半个多世纪都没有看到足够震撼的技术进步,我在十多年前所学专业就是人工智能方向,那时虽不是冷门专业,但也谈不上是热门专业。

直到近些年机器学习在一些专业领域,例如语音识别、产品推荐、图像识别、棋类游戏等达到了跟人类相当甚至远远超出的程度,才使得计算机终于有了接近人类智能的水平。

而这些震撼成果的取得,几乎都离不开机器学习或者说离不开“深度学习”。深度学习简单说就是基于深度神经网络的学习,由于其模拟了人类大脑的神经网络构成,极有可能是真正实现人工智能梦想的关键所在。像科大讯飞的语音识别输入法,著名的Google围棋程序AlphaGo,无人驾驶汽车等都是基于深度学习的。

近些年深度学习的发展极大的提升了机器学习的地位,更进一步的,促进了整个人工智能水平的提高,使得人工智能重新站在了时代的浪潮之巅。关于深度学习以后专题再聊,现在你只需要知道“深度学习”是“机器学习”的一个分支或者说重要组成部分。

再回到最前面,机器学习与大数据、云计算、数据挖掘、模式识别、统计学等有什么关系?

以前我们提到,机器学习有一个必要前提:必须有过往的经验,或者说有过往的数据。如果这个过往的经验或者说数据非常庞大,就涉及到“大数据”的处理。

大数据,顾名思义,就是非常大的数据,而“云计算”又可以简单理解为利用互联网的分布式并行处理、分布式数据库和异地存储、虚拟化等技术进行“大数据”处理的工具,而且是“大数据”必然要使用的工具。

机器学习需要用到的数据,可以是少量数据,也可以是很大的数据。如果是很大的数据,那机器学习和大数据就紧密结合了,但是两者并不等同。而云计算和大数据,你可以理解为一个硬币的正反2面,云计算就是为大数据而生的,而大数据也必须要用云计算来处理。

对于数据挖掘,你可以认为:数据挖掘现在约等同于机器学习。但是,数据挖掘是更宽泛的概念,就像“发消息”,可以“用短信发消息”,也可以“用微信发消息”,只不过现在“发消息”默认是“用微信发消息”,就像“数据挖掘”现在默认是用机器学习的方法来挖掘数据一样,以前可以自制图表挖掘,也可以用excel数据表格挖掘,这些方法现在看来比较low了。也许将来某一天,机器学习也变low了,数据挖掘用了更高级的方法。

对于模式识别,十几年前我所学的专业就是这个,当时的专业名称叫“模式识别与智能系统”。模式识别,顾名思义就是识别事物中的模式、规律,你可以认为:模式识别等同于机器学习。只不过模式识别源自工业界的叫法,机器学习源自计算机业界的叫法。当然,模式识别这个词现在用的比较少了,作为一个术语而言,在上世纪80、90年代比较流行,现在已经有点过时了,你可以用机器学习代替它。

对于统计学,你可以理解为:统计学是机器学习的基础,就像数学是物理学的基础一样。机器学习中的大多数方法都来自于统计学,就像物理学中的大多数方法来自于数学,区别就在于统计学(数学)更偏重理论,机器学习(物理学)更偏重应用。

来源:CSDN,作者:saltriver,转载此文目的在于传递更多信息,版权归原作者所有。
原文链接:https://blog.csdn.net/saltriver/article/details/68943821

推荐阅读