机器学习

机器学习中的方差、偏差和噪声

机器学习算法一般都会有训练和测试的过程,而且算法在不同训练集上学得的模型,测试的结果也很可能不同。一般来说,算法的方差衡量了训练集的变动导致的模型性能的变化,即多次训练的模型之间的性能差异性。偏差则是度量算法的期望输出与真实标记的区别,表达了学习算法对数据的拟合能力。而噪声则表示数据的真实标记与数据在数据集上标记的区别,表明算法在当前任务上能达到的测试误差的下界。

民主化与自动化:降低机器学习门槛的六大工具

过去,机器学习这个名词的头上曾经笼着科学的光环,只有少数高薪数据科学家才懂得如何用数据“喂养”复杂的算法,得出有用的分析结果。但如今随着自动化工具的快速发展,数据的采集、结构化和分析已经变得更加容易,机器学习的使用门槛已经大幅降低,即使那些不懂编程的业务人员,只要能提出正确的问题,同样也能用机器学习工具得到想要的结果。

Xgboost有哪些优点?

xgboost中的基学习器除了可以是CART(gbtree)也可以是线性分类器(gblinear)。xgboost主要优点:xgboost不仅使用到了一阶导数,还使用二阶导数,损失更精确,还可以自定义损失;XGBoost的并行优化,XGBoost的并行是在特征粒度上的​​​​​​​;考虑了训练数据为稀疏值的情况,可以为缺失值或者指定的值指定分支的默认方向,这能大大提升算法的效率......

为什么特征相关性非常的重要?

机器学习模型的好坏取决于你所拥有的数据。这就是为什么数据科学家可以花费数小时对数据进行预处理和清理。他们只选择对结果模型的质量贡献最大的特征。这个过程称为“特征选择”。特征选择是选择能够使预测变量更加准确的属性,或者剔除那些不相关的、会降低模型精度和质量的属性的过程。

交叉验证(Cross Validation)原理小结

交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。 

人工智能和机器学习中你应该知道的前20个API

应用程序编程接口(API)是一个现成的代码,可以简化程序员的生活。它有助于数字化单调的任务并自动化一系列复杂功能,从而降低生产成本。在AI/ML编程方面,处理将商业API集成到现有平台中。它可以与当前的代码片段进行交互,当然还可以与用户群进行交互。本文列出了20个适合AI和ML编程的API。选择是完全基于平台的效率,易用性和功能,而不是它的受欢迎程度。不包括像谷歌,IBM或微软平台等大玩家。

关于人工智能和机器学习的新趋势

人工智能在各产业中的超凡表现奠定了它对未来世界不可或缺的地位,比如制造业、医疗保健、建筑业、在线零售业等几乎各个行业都在利用人工智能技术融入物联网。不断演化的机器学习技术使每个企业都有望成为数据驱动的企业,都能利用云平台的机器学习技术使用人工智能应用程序。未来的企业将不必安装和维护机器学习系统,花很低的开销就能分析海量又复杂的数据,最终做出详细精准的分析和预测。