机器学习

机器学习模型脆弱性和安全性的提议

本文的目标是在流行的、传统的预测建模系统(如基于静态数据集训练的线性和树型模型)的上下文中,对潜在的安全漏洞和防御方法进行头脑风暴。虽然我不是安全专家,但我一直在密切关注机器学习的调试、解释、公平性、可解释性和隐私等领域。我认为这些领域中的许多技术可以应用于攻击和防御预测性模型系统。

有关扩大机器学习规模的五个启发

Gartner最近的一项调查显示,很多公司才刚刚开始机器学习之旅,而37%的组织已经实施了人工智能。如果你已经准备好接受机器学习,你可能先要评估十个问题或评估人工智能、机器学习和深度学习的完整指南,然后才能对机器学习进行概念验证。

正则项的理解之正则从哪里来

说到分类就要说到线性可分和线性不可分。这是属于模式识别中的概念。在欧几里德几何中,线性可分是一组点的集合性质。最容易描述的情况是在二维平面中,有一些点,分别是红色的点和蓝色的点。如果我们可以使用一条直线将不同颜色的点分开,那么这些点就是线性可分的......

机器学习算法中的F值(F-Measure)、准确率(Precision)、召回率(Recall)

在机器学习、数据挖掘、推荐系统完成建模之后,需要对模型的效果做评价。业内目前常常采用的评价指标有准确率(Precision)、召回率(Recall)、F值(F-Measure)等,本文将对其中某些指标做简要介绍。

EM算法原理总结

EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。

K-Means聚类算法原理

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优化Mini Batch K-Means算法。