机器学习

机器学习中如何选择分类器

在机器学习中,分类器作用是在标记好类别的训练数据基础上判断一个新的观察样本所属的类别。分类器依据学习的方式可以分为非监督学习和监督学习。

非监督学习顾名思义指的是给予分类器学习的样本但没有相对应类别标签,主要是寻找未标记数据中的隐藏结构。

监督学习通过标记的训练数据推断出分类函数,分类函数可以用来将新样本映射到对应的标签。在监督学习方式中,每个训练样本包括训练样本的特征和相对应的标签。监督学习的流程包括确定训练样本的类型、收集训练样本集、确定学习函数的输入特征表示、确定学习函数的结构和对应的学习算法、完成整个训练模块设计、评估分类器的正确率。

这一节的目的是分类器的选取。可以依据下面四个要点来选择合适的分类器。

1. 泛化能力和拟合之间的权衡

图像分类 | 深度学习PK传统机器学习

图像分类,顾名思义,是一个输入图像,输出对该图像内容分类的描述的问题。它是计算机视觉的核心,实际应用广泛。

图像分类的传统方法是特征描述及检测,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况非常复杂,传统的分类方法不堪重负。现在,我们不再试图用代码来描述每一个图像类别,决定转而使用机器学习的方法处理图像分类问题。

图像分类 | 深度学习PK传统机器学习

目前,许多研究者使用CNN等深度学习模型进行图像分类;另外,经典的KNN和SVM算法也取得不错的结果。然而,我们似乎无法断言,哪种方法对于图像分来问题效果最佳。
图像分类 | 深度学习PK传统机器学习

本项目中,我们做了一些有意思的事情:

机器学习中的基本数学知识

线性代数(linear algebra)

第一公式

机器学习中的基本数学知识

这是在机器学习中,最常见的公式。我把这个称为机器学习的第一公式,实际上就是线性分类函数(linear classifier)。
训练分类器的目标就是求出(w,b)。
其中:
x 是一个一行矩阵[[x1,x2,...,xn]]。
w 是一个一行矩阵[[w1,w2,...,wn]]。
x 和 w 的维度相同。
b 是一个数。

机器学习目前是 IT 领域最热门的话题之一,这是因为它在看似无限的应用场景中都能发挥自身的作用。从检测欺诈网站到自动驾驶汽车,再到识别你的“金牌会员”身份以进行价格预测等等。

但这个如此有吸引力的领域未来将如何发展?会走向何处?下一个最好的东西又将是什么?未来十年我们将处于什么样的位置?无论下一个巨大的改变是否会给我们所有人带来惊喜,本文将对机器学习将发挥作用的领域和用例做出五个预测。

1. 量子计算(Quantum Computing)

机器学习任务涉及到诸如在高维空间中对大量向量进行处理和分类的问题。我们目前用来解决这些问题的经典算法都需要耗费相当的时间。而量子计算机在处理巨大张量积(tensor product)空间中的高维向量时,可能会处理得更好。无论是有监督还是无监督的量子机器学习算法发展,都能比经典算法更快速地以指数方式增加向量数和维数,这将使得机器学习算法运行速度的大幅增加。

相关开源项目推荐:

10个机器学习的JavaScript示例

作者:雪飞鸿
原文地址:10 Machine Learning Examples in JavaScript

在过去的每一年,用于机器学习(Machine Learning)的库在变得越来越快和易用。一直以来Python都是机器学习的首选语言,但现在几乎可将所有语言用于神经网络(neural networks),这里当然也包括JavaScript!

近几年,Web生态系统取得了很大进步,虽然JavaScript和Node.js的性能比Python和Java略差,但它们已足够处理许多机器学习问题。Web语言具有被广泛且易于使用的优势——你只需一个Web浏览器就可以运行一个JavaScript语言编写的机器学习项目。

虽然许多JavaScript语言编写的机器学习库是刚刚诞生并且还在持续开发中,但还是值得去尝试使用它们。这篇文章会介绍几个JavaScript语言编写的机器学习库以及一些很酷的AI Web应用示例,它们可以很好的帮助你开始AI之旅。

1. Brain

深度长文:关于AI,你最该了解可也许从没想过的四个问题

在过去的几年里,我们一直在讨论人工智能(AI)将如何拯救或摧毁世界:自驾车有利于保护我们的生命; 社交媒体泡沫将破坏民主;机器烤面包机会让人类连烤面包的能力都丧失。

你可能很清楚,这其中的一些是无稽之谈,一些是真实的。但是,如果你没有深入地沉浸在这个领域,可能很难分辨孰真孰假。虽然对于想要学习人工智能编程的人来说,互联网上有大把的启蒙教程,但对于不想成为软件工程师或者数据专家的人来说,却缺乏对于人工智能的概念的了解,以及它所面临的社会上和伦理学上的挑战。

如果全社会真的要讨论人工智能,我们就需要解决这个问题。所以今天我们要谈谈人工智能的现实:它能做什么,不可能做什么,未来可能可以做些什么,以及它带来的一些社会、文化和道德方面的挑战。我不会涵盖每一个可能的挑战; 其中的一些,譬如泡沫和虚假信息,大的需要一整篇文章来解释。但是,我会给你们足够的例子说明我们所面临的真正的问题,你们就能够独立提出自己的问题。

我先给大家剧透一下: 大多数最难的挑战不是来自于技术。人工智能最大的挑战往往始于,它迫使我们编程时不得不非常明确地表达我们的目标 ,几乎没有别的事情会这样——而有的时候,我们并不想对自己说实话。

1、人工智能和机器学习

AI实践者需要掌握的10大深度学习方法

过去10年,人们对机器学习的兴趣激增。几乎每天,你都可以在各种各样的计算机科学课程、行业会议、华尔街日报等等看到有关机器学习的讨论。在所有关于机器学习的讨论中,许多人把机器学习能做的事情和他们希望机器学习做的事情混为一谈。从根本上讲,机器学习是使用算法从原始数据中提取信息,并在某种类型的模型中表示这些信息。我们使用这个模型来推断还没有建模的其他数据。

神经网络是机器学习的一种模型,它们至少有50年历史了。神经网络的基本单元是节点(node),基本上是受哺乳动物大脑中的生物神经元启发。神经元之间的连接也以生物的大脑为模型,这些连接随着时间的推移而发展的方式是为“训练”。

在20世纪80年代中期和90年代初期,许多重要的架构进步都是在神经网络进行的。然而,为了得到好的结果需要大量时间和数据,这阻碍了神经网络的采用,因而人们的兴趣也减少了。在21世纪初,计算能力呈指数级增长,计算技术出现了“寒武纪大爆发”。在这个10年的爆炸式的计算增长中,深度学习成为这个领域的重要的竞争者,赢得了许多重要的机器学习竞赛。直到2017年,这种兴趣也还没有冷却下来;今天,我们看到一说机器学习,就不得不提深度学习。

人工智能和机器学习有什么区别?

人工智能(AI)和机器学习(ML)现在是两个非常热门的流行语,通常似乎可以互换使用。但这二者并不完全一样,但是有时会导致人们的看法有一些混乱,因此需要解释这二者之间的区别。当大数据、数据分析,以及更广泛的技术变革浪潮席卷全球时,这两个术语都会频繁出现。总之,最好的答案是:人工智能是一种机器能够以人们认为“聪明”的方式执行任务的更广泛的概念。而且,机器学习是人工智能的一个最新应用,它基于这样一个想法:真的应该能够让机器访问数据,让他们自己学习。

早期的发展

人工智能已经存在了很长一段时间——希腊神话中就有模仿人类行为的机械人的故事。早期的欧洲研发的计算机被认为是“逻辑机器”,通过复制诸如基本算术和记忆等功能,工程师们从根本上认为他们的工作是试图创造机械的大脑。

作为技术,重要的是,人们对于人类的思想如何运作的理解已经取得了进展,我们对人工智能的构想的概念发生了变化。人工智能领域的工作不是日益复杂的计算,而是集中于模仿人类决策过程和以更具人性化的方式执行任务。

人工智能设备被设计成为具有智能行为的设备通常被分为两个基本群体之一——应用型或通用型。应用人工智能则是更为常见的,例如,智能地交易股票和股票的系统,或操纵自主车辆的系统将属于这一类。

机器学习工具:Python 和 Numpy入门

写在前头

我们一般都是从C语言开始学起的,后来发现C语言不能满足我们快速开发的需求,因为它的API使用起来不很方便,还有就是有些功能亟待扩展,这时候我们很多人选择了C++或Java,C#,这些更高级的语言让我们开发软件时,使用起来更方便了。如今,随着人工智能时代的到来,Python迅速成为了机器学习,深度学习的必备语言,流行的机器学习库,sklearn,完全是基于Python开发的API,深度学习库tensorflow也是对Python的支持最好。

由此可见,随着时代的发展,各种语言不断迭代,顺应时代的需求。这样看来,作为开发者的我们除了要学习机器学习,深度学习的一些理论和算法的同时,还得去学各种语言,真的看起来很辛苦,有时候好不容易学会一门语言后,它已经又被新的语言迭代掉了。

实际上,当你深入了掌握一门语言后,再学起其他语言来就会相对更快,与那些从来没接触一门编程语言的来比起来。这是为什么呢?

原来,任何一门语言,本质上都是语言定义的内置类型和相关的API,及我们的扩展自己所需要的类型及定义的方法。

因此,我们只需要把握住两点就能很快入门这门语言:
• 基本数据类型及封装的API
• 库内定义通用API,如文件处理等

如何向普通人解释机器学习、数据挖掘

随着数据科学在人工智能发展中大放异彩,数据挖掘、机器学习进入了越来越多人的视野。而对于很多人来说,诸如机器学习之类的名次听起来是神乎其技,但其真正的内涵却不为一般人所知。

特别是对于从事数据科学领域的人来说,如何向外行人解释自己所从事的工作几乎是一个超级难题。那么到底什么是机器学习,如何用通俗易懂的语言来解释?我们通过以下几重境界来解释。

一、专业理论型

百科定义+专业术语,让人听起来不明觉厉,实则一脸懵逼

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。

同步内容
--电子创新网--
粤ICP备12070055号