机器学习

关于如何使用机器学习来做异常检测的7个问题

问问题是学习的最好方法之一。但有时你不知道从哪里开始,或者该问什么 —— 尤其是在你还比较熟悉的异常检测之类的话题上。在这种情况下,最好倾听别人的问题,让他们的思路来指导你的学习。

TensorFlow中最大的30个机器学习数据集

由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台,适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南,以及开放数据集的语料库。为了帮助你找到所需的训练数据,本文将简要介绍一些用于机器学习的最大的TensorFlow数据集。我们已经将下面的列表分为图像、视频、音频和文本数据集。

所有机器学习项目都适用的检查清单

为什么我需要一个清单?因为在一个项目中,你需要处理许多元素(争吵、准备、问题、模型、调优等等),所以很容易失去对事情的了解。这个清单可以引导你完成接下来的步骤,并促使你检查每一个任务是否执行成功。

7大分类,40多个关键概念,入门机器学习要掌握的概念都在这里了

很多时候,我们在学习过程中迷失了方向,从而失去了继续学习的动力。许多概念需要系统化。但是今天,我想为大家介绍机器学习的所有概念,这些概念将有助于你更快地了解这个领域。这篇文章将适合那些刚刚入门并且已经在实践中开始使用机器学习的人。

机器学习理论基础--常用算法思想要点

机器学习是通过算法使得机器从大量历史数据中学习规律,从而对新样本做分类或者预测。一个机器学习过程主要分为三个阶段:(1)训练阶段,训练阶段的主要工作是根据训练数据建立模型。(2)测试阶段,测试阶段的主要工作是利用验证集对模型评估与选择。(3)工作阶段,工作阶段的主要工作是利用建立好的模型对新的数据进行预测与分类。

详解准确率、精确率、召回率、F1值等评价指标的含义

机器学习问题之中,通常需要建立模型来解决具体问题,但对于模型的好坏,也就是模型的泛化能力,如何进行评估呢?很简单,我们可以定一些评价指标,来度量模型的优劣。比如准确率、精确率、召回率、F1值、ROC、AUC等指标,但是你清楚这些指标的具体含义吗?一起来看看吧。

机器学习中安全与隐私问题(对抗性攻击)

近几年,机器学习异常火爆,可以用来解决各种各样的问题,但却很少有人意识到机器学习本身也容易受到攻击,终于Ian Goodfellow和Papernot首次将机器学习的攻击提出,并且做了很多非常重要的研究,这里给出这二位大牛的博客的翻译,有兴趣的朋友可以关注一下,觉得还是很有意思的研究。本文也是安全方面的学习,有兴趣的希望可以一起讨论学习~~

机器学习--K近邻 (KNN)算法的原理及优缺点

K近邻法(k-nearst neighbors,KNN)是一种很基本的机器学习方法。它的基本思想是: 在训练集中数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类。