机器学习

交叉验证(Cross Validation)原理小结

交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。 

人工智能和机器学习中你应该知道的前20个API

应用程序编程接口(API)是一个现成的代码,可以简化程序员的生活。它有助于数字化单调的任务并自动化一系列复杂功能,从而降低生产成本。在AI/ML编程方面,处理将商业API集成到现有平台中。它可以与当前的代码片段进行交互,当然还可以与用户群进行交互。本文列出了20个适合AI和ML编程的API。选择是完全基于平台的效率,易用性和功能,而不是它的受欢迎程度。不包括像谷歌,IBM或微软平台等大玩家。

关于人工智能和机器学习的新趋势

人工智能在各产业中的超凡表现奠定了它对未来世界不可或缺的地位,比如制造业、医疗保健、建筑业、在线零售业等几乎各个行业都在利用人工智能技术融入物联网。不断演化的机器学习技术使每个企业都有望成为数据驱动的企业,都能利用云平台的机器学习技术使用人工智能应用程序。未来的企业将不必安装和维护机器学习系统,花很低的开销就能分析海量又复杂的数据,最终做出详细精准的分析和预测。

戴文渊:机器学习教科书的 7 大经典问题

科技发展很快,数据在指数级增长,环境也在指数级改变,因此很多时候教科书会跟不上时代的发展。有时,即便是写教科书的人,也不见得都明白结论背后的“所以然”,因此有些结论就会落后于时代。针对这个问题,第四范式创始人、首席执行官戴文渊在公司内部分享上,向大家介绍了机器学习教材中的七个经典问题。本文根据演讲实录整理,略有删减。

[深度学习] 不平衡样本的处理

机器学习中经典假设中往往假定训练样本各类别是同等数量即各类样本数目是均衡的,但是真实场景中遇到的实际问题却常常不符合这个假设。一般来说,不平衡样本会导致训练模型侧重样本数目较多的类别,而“轻视”样本数目较少类别,这样模型在测试数据上的泛化能力就会受到影响。

机器学习是如何区分猫和狗的?

最近人工智能方面最重要的发展之一就是机器学习了。它主要着眼于智能,而不是传统计算机程序意义上指定机器做什么东西,也就是说机器自己可以学习,这样它就可以直接从经验(或者数据)中学会如何处理复杂的任务。