人工智能及其应用简介

作者:刘以栋

当今世界,人工智能是一个热门话题,有人甚至预言以后可以娶一个机器人做老婆,这无异于天方夜谭。

出于对人工智能的兴趣,我自己也去读了一些人工智能的入门书。这是我人工智能读书报告第一篇,以后会有人工智能不同领域的读书报告。我自己不是做人工智能方面工作,所以只是编译了这篇科普文章,不到之处请谅解。

人工智能本身不是一个新概念。早在1956年夏天,一帮科学家就在达特茅斯大学提出了计算机的推理能力功能。距今已经60多年。

人工智能简单的来说包括三个部分,接受信息,处理信息和做出行动。当然,这其中任何一部分都可以是人工智能的一个研究领域。接受信息包括语音识别,模式识别,计算机视觉等。处理信息就是计算机的推理能力,最有名的例子就是下围棋的阿法狗(AlphaGo)。行动部分的例子包括机器人和自动驾驶车。

在讨论人工智能以前,让我们先复习一下人的七种智能。

1. 视觉空间智能(Visual-Spatial Intelligence)

周围环境辨别能力是任何运动机器人都需要掌握的能力。自动驾驶车和自动吸尘器都需要看到周围的情况。吸尘器要求精度低。人工智能在这方面只能达到中等水平。

2. 身体运动智能 (Bodily Kinesthetic Intelligence)

外科医生和舞蹈演员需要调整身体姿势来完成动作。人工智能可以辅助医生做手术。机器人需要在人的指令下操作。这方面人工智能可以达到中高水平。

3. 创造智能 (Creative Intelligence)

创造智能包括新的想法,新的音乐篇章,发现新的模式,新的发明等。人工智能可以模仿人的行为,但是它自己不能有发明创造。人工智能在这方面的潜力是零。

4. 人际交往智能 (Interpersonal Intelligence)

人和人之间的相互交流,譬如会议上或者电话上交流信息等,不是人工智能所长。人工智能可以根据关键词回答简单问题,但是人工智能不能理解整个句子。这个方面人工智能只能达到低中水平。

5. 内心自省智能 (Intrapersonal Intelligence)

一个人通过反省,发现自己的兴趣和专长,然后设定自己的奋斗目标,是人类特有的能力。人工智能在这方面的潜力是零。

6. 语言智能 (Linguistic Intelligence)

语言交流能力,包括听懂对方讲话,或者读懂对方的信函,然后通过思考,作出回答。人工智能一般不能听懂对方讲话,也不能读懂书信,更不要说根据对方要求做出回答了。人工智能在语言交流方面只能达到初等水平。

7. 逻辑数学智能 (Logical - Mathematical Intelligence)

进行数学运算,探索模式,寻找规律是人工智能所长。人工智能在这方面可以达到高级水平。

多元智能一览

不管我们是否喜欢人工智能,人工智能已经进入了我们生活中的方方面面。

我们打字时,人工智能经常给我们改错。有的时候,人工智能提出改正要求,等我们确认。有的时候,人工智能来不及等我们确认,自己做决定。譬如,如果我们开车时,前面有障碍,人工智能可以紧急刹车。人工智能反应比人快。

人工智能也可以使我们工作中的许多事情自动化。自动取款机应该算人工智能的一种形式。

自动化可以取代我们工作中的无聊重复部分,使得我们的工作更有趣。我们去工作,钱是一部分原因,工作中的满足感是另一部分原因。自动化还可以提高工作效率,增加工作环境的安全性。

人工智能在医疗方面也有许多应用。人工智能医疗仪器可以戴在身上,这样可以收集长期数据,监督病人情况。人工仪器也可以增加人的体能,人可以通过穿着一种机器人(Exoskeleton, 外骨骼),这样可以跑得更快,负重更多 …..

机器人护理有它的两面性。一方面,机器人做事可能更客观,另一方面,人是有感情的。机器人不会提供同情和理解。

人工智能在人和人之间的交流方面也有帮助。机器人在文字以外,又增加了表情包。机器人可以做自动翻译,Google 的翻译就不错。

机器人在交流领域的新的突破是身体语言。人跟人交流时,除了语言表达以外,还有身体语言。机器人可以捕捉到人的身体语言,譬如姿势,头的动作,面部表情,眼睛接触和手势等,帮助理解人的意图。我个人认为,身体语言在中国不是很重视,但是我们确实不可忽视身体语言。

人工智能的发展包括两个大的领域:软件方面发展起来的人工智能和硬件方面发展起来的人工智能。

大数据,机器学习都属于人工智能在软件方面的发展。

我们这个时代被称为信息时代并不仅仅是我们有很多数据,而是因为我们在分析数据方面达到了一定的成熟度,从而使得我们可以从数据中提取有用的信息。

搜狗 (Google),亚马逊(Amazon),苹果,脸书和微软是5个市值最高的公司,其主要原因是它们的商业模式都是建立在数据上面。

数据是新时代的石油。石油不能被直接被用来做化工制品,它必须先经过提炼。同样,数据在使用前,必须做相应的处理。

数据处理可以包括下面的相关步骤:

数据变换(Transforming)。改变数据的面貌。数据变换可以指不同的形式,但是其主要形式就是把数据按矩阵形式排列。譬如,你去商店购物,商店把每个顾客归在一行,然后每列是购买的物品数量和价格。

数据净化(Cleansing)。改正不完美的数据。不同的数据收集方法会有不同的数据问题,譬如数据缺失,数据值不合理和错误数据等。譬如,网上有的物品和服务评论可能是假的,或者是朋友写的,或者是竞争对手写的。根据这些不可靠的数据,可能会得出错误的结论。数据净化就是要把不可靠数据去掉。

数据检查(Inspecting)。验证数据。虽然计算机可以在数据分析中起很大作用,但是数据分析很大程度上仍然是人的工作。人很容易识别模式,并发现异常数值,譬如客户年龄小于10岁或者大于90岁。

数据造型(Modeling)。掌握数据里不同因素的关系。通过统计方法,发现客户购买不同物品之间的关系。譬如,我们去亚马逊买东西时,它会推荐相关产品。

数据分析在人工智能领域至关重要。业内人士认为,人工智能直到现在才开始腾飞,其主要原因是数据质量和数据来源的提高。

数据分析的最高层次是机器学习。机器学习的中心思想是,在事先没有已知算法的情况下,机器通过分析数据,用数学公式表达现实世界。机器学习让我们可以用未知的数学函数来表达复杂的现实世界。而这个复杂的数学函数,是机器的内部算法通过数据自己学会的。

机器学习过程完全是一个数学逻辑过程。它通过数学形式把输入和输出联系起来。机器学习完全没有理解算法学到了什么东西,而仅仅是内部算法把输入和输出建立起一个函数关系。所以,机器学习过程也是一个机器训练过程。

想象一下我们教孩子学习。我们教孩子认识什么是树,然后告诉孩子树的结构,形状,并让孩子看很多树的图片,这样孩子就知道树是什么样的。

机器学习是一个类似的过程。它通过数学公式形式,建立机器的感知能力。机器内部算法记住各种物体的特征,然后产生辨别物体的能力。

机器的学习能力和人的智力是不一样的。人们不能期待机器有人的智力并完全具有人的智能。

机器学习的三个主要缺陷:

1. 表述能力(Representation)。用数学语言表述一个复杂问题是一件困难的事情,特别是要模拟人脑。到目前为止,机器学习只能回答简单问题,这是什么?这个多少钱?下一个是什么?

2. 过度拟合(overfitting)。机器学习似乎可以学习我们关心的事情,事实上它们不能。机器学习系统只是记住了数据,其实它并没有理解数据。过度拟合指的是算法从数据中学到了太多关系,而这些关系在现实中是不存在的。经济学上说,如果一个少胳膊的人跑得快,你不能得出结论,少胳膊可以使人跑得快。

3. 在数据有限的情况下,机器学习缺少举一反三的能力(Lack of effective generation because of limited data)。机器只能学会你教它的东西。如果你给机器提供不好的数据,那么它产生的结果就难以预料。微软搞了一个对话机器人(Taylor), 它很快就学会了许多脏话。

机器学习的三种主要算法(Machine Learning Algorithms):

1. 监督学习 (Supervised Learning)。

监督学习就像我们人类在老师指导下学习。老师给学生举出有用的例子,学生记住例子并推导出一般规律。统计回归,数据分类,图像识别,语音识别,机器翻译,自动驾驶车等,都是监督学习。

2. 无监督学习 (Unsupervised Learning)。

无监督学习是让机器从数据中寻找规律,把数据或者物品分类,给人提供意想不到的内在联系。我们在网上购物时,有些广告会弹出来,这就是机器学习的结果,它认为,你对其它相关物品也会感兴趣。

3. 加强学习 (Reinforcement Learning)。

加强学习就是给算法提供没有结论的例子,但是给机器提供正面或者负面的反馈。这跟人类的反复试验学习方法一样。简单的例子就是计算机学习玩电子游戏。Google 的 DeepMind 就是一个加强学习的例子,它刚开始游戏玩得不好,但是后来变成冠军。

机器学习算法

机器学习的三种主要方法(Three most promising AI learning approaches):

1. 朴素的贝叶斯 (Naive Bayes)。 这种算法可以比医生做出更精确的诊断结果。它也可以探测垃圾邮件和文字里的情绪。这种方法也经常被用来跟踪互联网上的大数据传运。

朴素贝叶斯

2. 贝叶斯网络 (Bayesian Networks, Graph Form)。这种图像可以用概率的形式表示复杂的世界。

贝叶斯网络

3. 决策树 (Decision Trees) 。决策树表现符号最佳。决策树历史悠久,它表示了人工智能的决策过程并因此而得名。

决策树

人工智能的深度学习。机器学习是人工智能的一部分,深度学习是机器学习的一部分,所以深度学习在人工智能里是一个很小的领域,但是媒体好像特别喜欢关注深度学习。

深度学习是人工智能模仿人的大脑神经系统的学习方法。人的大脑有神经网络,所以深度学习是用电脑模仿人的神经网络。

想象一下我们要过滤水,让水经过一层一层的过滤系统,最后得到干净的水。

同样,深度学习是把输入数据经过一层一层的信息网,通过一层一层的演算,最后得出结论。我自己的理解,最简单的神经网络就是线性回归,或者逻辑回归,用户输入数据,电脑做回归,建立输入和输出之间的关系。复杂一些的神经网络,每一层对数据做不同的处理和变换,调整变换的系数和权重,最后产生结果。

神经网络

我自己的理解,深度学习是一个迭代过程(Backpropagation),每个迭代过程的专业名称是时代(Epoch)。已知数据被输入到神经网络里,网络调整内部参数,然后拟合最佳结果。过度拟合也容易在这个过程中产生。深度学习的具体过程,我将会另文介绍。

前面我们提到,人工智能包括两个大的领域,软件方面的人工智能和硬件方面的人工智能。我们刚介绍了软件方面的人工智能的发展,下面我们介绍硬件方面人工智能的发展。

很多人把人工智能和机器人混为一谈,但是机器人和人工智能是两回事,虽然这两者有很多重叠部分。

人工智能是为了像人一样解决复杂问题,而机器人是在现实世界里把人的想法自动化。

介绍机器人以前,我们先了解一下机器人的三个规则:

1、机器人不可以伤害人,或者通过不作为而使得人遭到伤害(First Law – A robot may not injure a human being or, through inaction,allow a human being to come to harm)

2、机器人必须服从人的指令,除非人的指令违背前面的第一条规则(Second Law – A robot must obey the orders given it by human beingsexcept where such orders would conflict with the First Law)

3、机器人必须保护它自己的存在,除非这种保护跟前面的第一条或者第二条相冲突(Third Law – A robot must protect its own existence as long as suchprotection does not conflict with the First or Second Laws)。

现在各种各样的机器人已经很多,但是大家关心的主要机器人包括无人驾驶飞机和自动行驶的汽车。限于篇幅,这里只介绍一下自动驾驶汽车。

在神话自动驾驶车以前,我们先看一下自动驾驶车的自动化程度分类。


1. 给驾驶员提供帮助。

车的控制仍然在人手中,但是车可以提供一些简单的帮助,譬如控制车的速度。其实我们的巡航控制(Cruise Control),和预设刹车系统就是这个功能。

2. 部分自动驾驶。

车更多的时候不需要人的干预。车可以根据路况调整速度,这样驾驶员只需要保持警惕就可以。自动巡航控制就是这种功能。

3. 有条件自动驾驶。

目前生产中的自动驾驶车基本在这个水平。车可以在特定的路况下自动驾驶,譬如高速公路或者单向行驶的公路。车可以根据路况刹车,人只要关注并在紧急情况下接管驾驶。

4. 高度自动驾驶。

车可以像人一样转方向盘,踩油门,刹车,并根据路况从出发点到终点做路况驾驶调整。车的驾驶不需要人的干预,只是在特定的情况下才需要人的操作。人只需要随车监督就行。预计2020年这样的车可以上路。

5. 完全自动驾驶。

车可以完全自动驾驶,从出发点到终点,车都不需要人的干预。这样的车已经没有方向盘,根本不需要驾驶员。预计2025年这样的车可以上路。

自动驾驶车可以提供下面的几个好处。

1. 很少发生交通事故。

因为自动驾驶车严格遵从交通规则,所以事故很少发生。因为没有人驾驶,车的安全保护措施就没有必要,所以未来的车会很轻,甚至可以用塑料制造车。因为事故少了,车的保险费用也会下降。汽车保险业会受影响。

2. 人工驾驶的工作减少。

自动驾驶车就减少了专职驾驶员的需求。现在美国有300万人做驾驶工作。

3. 大家可以节省时间。

自动驾驶车可以给大家节省很多驾驶时间。大家可以把开车的时间去做别的事情。

生产自动驾驶车需要很多技术上的突破。

全球定位系统跟踪监视车在哪里并规划行车路线。

雷达,超声和光测仪(Lidar, Light Detection and Ranging) 发现周围物体和它们的运动情况。

车载相机告诉车周围的路况,指导车的行动。

不管我们是否喜欢,自动驾驶车会进入我们的生活。未来要么我们使用自动驾驶车,要么我们跟自动驾驶车共享马路。

在结束此文以前,让我简单归纳一下人工智能的未来。

人工智能的缺陷是它没有创造性,不能想象未来,也不会有原创性的想法。人工智能不会有情绪,也不会有内疚感。

人工智能的发展,要考虑下面现实世界的要求:


1. 经济合算。

人们在购买人工智能的应用以前,要看它是否比现在的现有应用合算。没有经济效益的应用就没有前途。

2. 可重复性。

人们期待人工智能的结果是可以重复的。这对现有的步骤性方法很容易,但是对有塑造性的人工智能应用却是一个挑战。

3. 高效。

经济规律要求在最少资源的情况下取得最好的结果。

4. 有效。

人工智能应用要提供人们需要的结果。

5. 实用。

所有的人工智能应用必须给人们提供实质性帮助。

现在人工智能很热,但是我们要警惕人工智能的冬天(AI Winter)。人们在开发人工智能的应用时,容易承诺过度,到时候却实现不了。这种过度乐观,最后会让投资者失望。人工智能的冬天以前发生过,以后仍然会发生。

本文转自:微信号 - 产业智能官(ai-cps),转载此文目的在于传递更多信息,版权归原作者所有。

推荐阅读