机器学习

透彻理解半监督学习的重要思想及概率视角

半监督学习本质上,是从小标记集和大非标记集学习。半监督学习(Semi-supervised Learning):训练集同时包含有标记样本数据和未标记样本数据,不需要人工干预,让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,就是半监督学习。

机器学习判别式与生成式

在机器学习中,对于监督学习我们可以将其分为两类模型:判别式模型和生成式模型。可以简单地说,生成式模型是针对联合分布进行建模,而判别式模型则针对条件分布建模。
从感性上认识,生成式能学习到更多信息,而判别式则较少,就好比学习英语,有类人只学会听懂这是英语,有类人学会了听懂这是英语并且知道说的是什么。另外,生成式模型在一定条件下也可以转换成判别式模型,比如通过贝叶斯公式进行转换。

解决做好一个机器学习项目的3个问题

机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注。

工程化的NLP如何确保落地?

NLP的工程化,不是一个个算法的累积,也不是一个个任务的独立优化,而应该是系统工程,综合考虑语言、计算、场景等多种因素,不断演进融合,寻求效果满意解的过程。根据赫伯特.西蒙(图灵奖和诺贝尔奖双料得主)的有限理性模型,受到所处环境的高度复杂性和有限的信息加工能力限制,因此NLP应用落地时,我们不可能遵循”最优化“的策略,而应该以获取当前可接受的“满意解"为目标。

机器学习:超参数的选择,余弦距离vs欧式距离vs曼哈顿距离

余弦相似度(Cos距离)与欧氏距离的区别和联系:欧式距离和余弦相似度都能度量 2 个向量之间的相似度;放到向量空间中看,欧式距离衡量两点之间的直线距离,而余弦相似度计算的是两个向量之间的夹角;没有归一化时,欧式距离的范围是 (0, +∞],而余弦相似度的范围是 (0, 1];余弦距离是计算相似程度,而欧氏距离计算的是相同程度(对应值的相同程度);归一化的情况下,可以将空间想象成一个超球面(三维),欧氏距离就是球面上两点的直线距离,而向量余弦值等价于两点的球面距离,本质是一样。

机器学习的五大流派

有道是“罗马不是一天建成的”,机器学习的发展也是历经了很长时间,在这过程中形成了五大流派:符号主义(Symbolists),贝叶斯派(Bayesians),联结主义(Connectionist),进化主义(Evolutionaries)和行为类比主义(Analogizer),这五大流派各有各的特点。

《常用算法之智能计算(三)》:机器学习计算

机器学习(Machine Learning),人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,主要使用归纳、综合而不是演绎的方法研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是一门多领域的交叉学科,涉及到概率论、统计学、逼近论、凸分析、算法复杂度理论和计算机科学等诸多学科。

在未来和AI争夺工作的16个实用技巧!

如今,许多公司都已经开始利用人工智能和机器学习,并且这些技术的影响只会越来越大。虽然这对于想要提高业绩的企业来说是件好事,但许多员工也担心机器人会在未来几年内取代他们的工作。

虽然人工智能可能会改变某些类型的工作,但它们永远不会完全取代人类的工作——你只需要知道如何维持并推销你的技能。来自福布斯教练委员会(Forbes Coaches Council)的成员们分享了一些技巧,让你可以在未来的职业生涯中获取所需的技能。

1. 学会理解数据的价值

虽然新的创新将要求每个人对技术越来越熟悉,但是这并不意味着每个人都能精通技术。而在学习计算和解释数据方面,技术则是一股很大的力量。这项技能将会见证劳动力需求的增加,并将有助于巩固作为雇员或潜在领导者的价值。——LaKisha Greenwade, Lucki Fit LLC

2. 学习,执行,教导,服务

机器学习失败的 6 种原因,你中招了吗?

一般来说,学习的过程通常意味着先犯错误以及选择错误的道路,然后再想明白如何在将来避免这些陷阱。机器学习也不例外。当你在你的企业中运用机器学习时,要小心:一些技术营销可能会告诉你机器学习的过程是又快又好的,但这是一种对技术的不切实际的期望。事实是,机器学习过程中必定会出现错误。

机器学习---生成模型与判别模型

生成模型(Generative Model)是相对于判别模型(Discriminative Model)定义的。他们两个都用于有监督学习。监督学习的任务就是从数据中学习一个模型(也叫分类器),应用这一模型,对给定的输入X预测相应的输出Y。这个模型的一般形式为决策函数Y=f(X)或者条件概率分布P(Y|X)。