机器学习

机器学习--K近邻 (KNN)算法的原理及优缺点

K近邻法(k-nearst neighbors,KNN)是一种很基本的机器学习方法。它的基本思想是: 在训练集中数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类。

8个提高机器学习模型的准确率的方法

模型的开发周期有多个不同的阶段,从数据收集开始直到模型建立。不过,在通过探索数据来理解(变量的)关系之前,建议进行假设生成步骤。我认为,这是预测建模过程中最被低估的一个步骤。花时间思考要回答的问题以及获取领域知识也很重要。这有什么帮助呢?它会帮助你随后建立更好的特征集,不被当前的数据集误导。这是改善模型正确率的一个重要环节。

总结机器学习与安卓恶意软件分析方案

根据安卓应用特点,我们可以风险分析分为静态与动态两种。分析的过程不执行应用的方法称之为静态分析。比如说,静态分析中的权限分析可以通过AndroidManifest.xml文件获取,api调用等可以通过逆向dex工作逻辑获得。而动态分析主要是分析应用运行之后的逻辑。

机器学习七原罪!

机器学习是一种伟大的工具,正在改变着我们的世界。 在许多伟大的应用中,机器(尤其是深度学习)已被证明优于传统方法。 从用于图像分类的Alex-Net到用于图像分割的U-Net,我们看到了计算机视觉和医学图像处理领域的巨大成功。 不过,我看到机器学习方法每天都在失败。 在许多这样的情况下,人们迷上了机器学习的七大罪过之一。