机器学习

机器学习贝叶斯超参数优化

机器学习中超参数优化的目的是找到给定机器学习算法的超参数,该算法返回在验证集上测量的最佳性能。与模型参数相比,超参数是由机器学习工程师在训练之前设置的。随机森林中的树数量是超参数,而神经网络中的权重是训练期间学习的模型参数。

机器学习需要注意的事项

大家都知道,机器学习在人工智能中是一个非常重要的内容,我们在进行学习人工智能之前要对机器学习有一定的了解,而机器学习中最重要的就是那些算法了,只有我们掌握了那些算法我们才能够更好地掌握和熟料机器学习的内容。对于机器学习我们需要清楚很多事情,我们在这篇文章中给大家总结了几点内容,希望这几点内容能够帮助大家解决更多的问题。

机器学习判别式与生成式

在机器学习中,对于监督学习我们可以将其分为两类模型:判别式模型和生成式模型。可以简单地说,生成式模型是针对联合分布进行建模,而判别式模型则针对条件分布建模。
从感性上认识,生成式能学习到更多信息,而判别式则较少,就好比学习英语,有类人只学会听懂这是英语,有类人学会了听懂这是英语并且知道说的是什么。另外,生成式模型在一定条件下也可以转换成判别式模型,比如通过贝叶斯公式进行转换。

解决做好一个机器学习项目的3个问题

机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注。

工程化的NLP如何确保落地?

NLP的工程化,不是一个个算法的累积,也不是一个个任务的独立优化,而应该是系统工程,综合考虑语言、计算、场景等多种因素,不断演进融合,寻求效果满意解的过程。根据赫伯特.西蒙(图灵奖和诺贝尔奖双料得主)的有限理性模型,受到所处环境的高度复杂性和有限的信息加工能力限制,因此NLP应用落地时,我们不可能遵循”最优化“的策略,而应该以获取当前可接受的“满意解"为目标。

机器学习:超参数的选择,余弦距离vs欧式距离vs曼哈顿距离

余弦相似度(Cos距离)与欧氏距离的区别和联系:欧式距离和余弦相似度都能度量 2 个向量之间的相似度;放到向量空间中看,欧式距离衡量两点之间的直线距离,而余弦相似度计算的是两个向量之间的夹角;没有归一化时,欧式距离的范围是 (0, +∞],而余弦相似度的范围是 (0, 1];余弦距离是计算相似程度,而欧氏距离计算的是相同程度(对应值的相同程度);归一化的情况下,可以将空间想象成一个超球面(三维),欧氏距离就是球面上两点的直线距离,而向量余弦值等价于两点的球面距离,本质是一样。

机器学习的五大流派

有道是“罗马不是一天建成的”,机器学习的发展也是历经了很长时间,在这过程中形成了五大流派:符号主义(Symbolists),贝叶斯派(Bayesians),联结主义(Connectionist),进化主义(Evolutionaries)和行为类比主义(Analogizer),这五大流派各有各的特点。

《常用算法之智能计算(三)》:机器学习计算

机器学习(Machine Learning),人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,主要使用归纳、综合而不是演绎的方法研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是一门多领域的交叉学科,涉及到概率论、统计学、逼近论、凸分析、算法复杂度理论和计算机科学等诸多学科。