demi的博客

为什么不建议在自治安全中推销机器学习

网络安全产品营销人员可能会这么向你推荐:有个新式的先进网络入侵设备,运用当前超智能的机器学习 (ML) 根除已知和未知入侵。这个 IDS 设备真是太聪明了,可以学习你网络上的正常和不正常事件,只要一发现异常就会马上通知你......但,销售说得天花乱坠,真相令人欲哭无泪。真正了解自治安全和机器学习的人不会被市场营销人员忽悠。

L1正则为什么更容易获得稀疏解?

L1和L2正则常被用来解决过拟合问题。而L1正则也常被用来进行特征选择,主要原因在于L1正则化会使得较多的参数为0,从而产生稀疏解,将0对应的特征遗弃,进而用来选择特征。但为什么L1正则会产生稀疏解呢?本文利用公式进行解释。

3D图形渲染通道负载优化的几种方法

一般来说, 定位渲染通道瓶颈的方法就是改变渲染通道每个步骤的工作量,如果吞吐量也改变了,那个步骤就是瓶颈。找到了瓶颈就要想办法消除瓶颈,可以减少该步骤的工作量,增加其他步骤的工作量。一般在光栅化之前的瓶颈称作”transform bound”,三角形设置处理后的瓶颈称作”fill bound”。

[科普]顶点着色器、片段着色器、uniform变量

着色器只是一种把输入转化为输出的程序。着色器也是一种非常独立的程序,因为它们之间不能相互通信;它们之间唯一的沟通只有通过输入和输出。在最简配置下,至少都得有两个着色器:一个叫顶点着色器(vertex shader),它将作用于每个顶点上;另一个叫片段着色器(fragment shader),它将作用于每一个采样点。我们采用4倍抗锯齿,因此每个像素有四个采样点。

卷积及卷积的性质与应用

卷积有一种模糊(粗粒度)的效果,这种模糊化(忽视掉一些不必要的细节,在加上 maxpooling 的存在,又会去捕捉最显著的特征,这种忽略次要目标,突出重要目标)。也就是 CNN 天然具有的性质,当其应用在 Text(文本处理)时,比如 fraud detection,欺诈检测,一个人抄袭别人的答案,但又机智地做了一些修改的动作(会被 conv,忽视),但一些核心的东西,两人之间一样的内容(执行 maxpooling 时),会被检测出来。

民主化与自动化:降低机器学习门槛的六大工具

过去,机器学习这个名词的头上曾经笼着科学的光环,只有少数高薪数据科学家才懂得如何用数据“喂养”复杂的算法,得出有用的分析结果。但如今随着自动化工具的快速发展,数据的采集、结构化和分析已经变得更加容易,机器学习的使用门槛已经大幅降低,即使那些不懂编程的业务人员,只要能提出正确的问题,同样也能用机器学习工具得到想要的结果。