demi的博客 | 电子创新网 Imgtec 社区

机器学习（十）—聚类算法（KNN、Kmeans、密度聚类、层次聚类）

demi 在周二, 11/13/2018 - 10:11 提交

聚类算法

任务：将数据集中的样本划分成若干个通常不相交的子集，对特征空间的一种划分。

性能度量：类内相似度高，类间相似度低。两大类：1.有参考标签，外部指标；2.无参照，内部指标。

距离计算：非负性，同一性（与自身距离为0），对称性，直递性（三角不等式）。包括欧式距离（二范数），曼哈顿距离（一范数）等等。

1、KNN

k近邻（KNN)是一种基本分类与回归方法。

其思路如下：给一个训练数据集和一个新的实例，在训练数据集中找出与这个新实例最近的k 个训练实例，然后统计最近的k 个训练实例中所属类别计数最多的那个类，就是新实例的类。其流程如下所示：

1、计算训练样本和测试样本中每个样本点的距离（常见的距离度量有欧式距离，马氏距离等）；
2、对上面所有的距离值进行排序；
3、选前k 个最小距离的样本；
4、根据这k 个样本的标签进行投票，得到最后的分类类别；
　　
KNN的特殊情况是k =1 的情况，称为最近邻算法。对输入的实例点（特征向量）x ，最近邻法将训练数据集中与x 最近邻点的类作为其类别。

简单易懂的讲解深度学习（入门系列之三）

demi 在周一, 11/12/2018 - 15:53 提交

在之前系列中已大致了解了机器学习的形式化定义和神经网络的概念，在本小节中，将相对深入地探讨一下神经网络中的神经元模型以及深度学习常常用到的激活函数及卷积函数。

3.1 M-P神经元模型是什么？

在前一小节中，已介绍了人工神经网络（ANNs）的定义。简单来说，它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。

神经网络依靠系统的复杂程度，通过调整内部大量“简单单元”之间相互连接的关系，从而达到处理信息的目的，并具有自学习和自适应的能力。

在上述定义中提及到的“简单单元”，其实就是神经网络中的最基本元素——神经元模型。在生物神经网络中，每个神经元与其它神经元，通过突触联接。神经元之间的“信息”传递，属于化学物质传递的。当它“兴奋（fire）”时，就会向与它相连的神经元发送化学物质（神经递质, neurotransmiter），从而改变这些神经元的电位；如果某些神经元的电位超过了一个“阈值（threshold）”，那么，它就会被“激活（activation）”，也就是“兴奋”起来，接着向其它神经元发送化学物质，犹如涟漪，就这样一层接着一层传播，如图3-1所示。

GDPR给安全带来的七大不利影响

demi 在周一, 11/12/2018 - 12:13 提交

微不足道的善意之举都有可能引发始料未及的巨大负面影响。而当这些举动对全世界的个人和公司企业都有影响的时候，这种未预料到的负面效果，有可能是灾难性的。有些专家就很担心，在新的隐私监管规定，尤其是欧盟的《通用数据保护条例》(GDPR)汹涌而来的时代，安全团队履行自己职责的能力会不会受到影响。

某些情况下，GDPR和《加州消费者隐私法案》(CCPA) 等法律，反而让安全团队束手束脚，让本应受到保护的个人信息被黑客轻易偷走。这些监管法案往往缺乏具体实施细节，出于对潜在惩罚的恐惧与不确定，公司企业就会采取一些妨碍安全团队的保守做法。

违反GDPR的代价过于巨大，因而你不得不为那些预料不到的后果考虑，而且因为无法使用Whois数据，无形中也扩大了威胁界面。因为GDPR的存在，可供黑客入侵的威胁界面显著增长，不是增加了一点点，而是翻了个数量级。

隐私控制非常有必要，但也有安全团队因为出于隐私顾虑，无法访问所需数据而拖慢了对攻击的响应。而且讽刺的是，因为坏人也享有隐私权，在隐私法案的保护下便有了藏身之处和逃脱之道。

这很有可能导致未来再曝出几起史上最大隐私泄露案。

有些情况下，是公司企业对安全团队的事件响应方式反应过度了。比如说，GDPR第49条似乎就对履行自己职责的安全团队进行了豁免：

图像处理中直方图匹配以及灰度拉伸

demi 在周一, 11/12/2018 - 10:11 提交

一、基本知识

图像对比度是指：一副图像中明暗区域最亮的白和最暗的黑之间不同亮度层级的测量，差异范围越大代表对比度越大；一般来说图像对比度a越大，图像越清晰醒目，色彩也越鲜明艳丽；对比度小让整个画面都灰蒙蒙；

图像饱和度是指：图像的鲜艳程度，也是色彩的纯度。饱和度取决于图像中该色中含色成分和消色成分的比例；纯的颜色饱和度都大；

图像的亮度是指：图像的明暗程度；

直方图均衡化以及灰度拉伸都是属于图像对比度增强的方法；

二、灰度拉伸

灰度拉伸是通过对对比度拉伸达到对对比度进行增强的目的；

公式为：

三、直方图均衡化及直方图匹配：

断开物联网：我们是否陷入太深？

demi 在周一, 11/12/2018 - 09:12 提交

对某些人来说，物联网（IOT）是信息和交流的仙境，而对于另一些人来说，他们更喜欢人与人之间的互动，不愿被他们设备上不断轰炸的警报信息所困扰。对于后者来说，物联网使我们不得不以某种方式或形式连接起来，更糟糕的是，随着我们在物联网上所花费的时间越多，我们就变得越来越紧密——这使得它越来越难以退出并断开连接。有人预测，很快，物联网将无法脱离。

今天，互联网用户人数已经达到全球人口的49%，另外，全球估计有84亿连网设备正在投入使用，而且这些数字还将随着时间推移呈指数级增长。物联网具有巨大的技术、社会和专业优势，但它并非没有不良后果，在很多情况下，规模如此之大的物联网也使得它变得异常凶险。物联网过于庞大和复杂，无法一时决定是接受还是拒绝，但它将有助于完全了解不断扩大的物联网含义。但是，不久之后，你将不得不决定是服用“红色药丸”还是“蓝色药丸”。

物联网的技术含义

人工智能与物联网安全：以子之矛，攻子之盾

demi 在周五, 11/09/2018 - 15:06 提交

随着现代威胁形势的不断扩大，将人工智能（AI）添加到安全策略中，对于建立和维持有效的安全状态变得至关重要。鉴于现代网络威胁的速度和复杂性以及当前网络安全技能的短缺，网络安全团队需要机器学习和其他基于AI的功能的帮助，以便检测、保护和缓解现代攻击。

然而，当企业采用人工智能来加强他们的安全工作时，网络犯罪分子也会采用敏捷软件开发，自动化和机器学习之类的东西，来潜在地利用人工智能来更好地识别和更快地利用网络漏洞，这一点也不足为奇。

实际上，由于越来越多的物联网和运营设备进入网络基础设施，网络犯罪分子已经有机会和能力发起快速且复杂的攻击，而这些固有的易受攻击的设备，将成为企业网络的入口通道。人工智能所带来的潜在攻击能力，只会进一步加剧对当今数字化转型工作的威胁。

因此，人工智能可能很快就会提供成功保护或攻击物联网的方法，以便有效地在网络安全专业人员和网络犯罪分子之间建立AI军备竞赛。

为了保护数字化转型并保持严格的安全状态，IT团队必须了解网络犯罪策略的最新变化，这些变化可能会在未来几年内导致AI驱动的威胁环境。他们还需要了解现在可以将哪些AI功能合并到他们的安全堆栈中，以便在他们的网络不断发展和扩展时保持一致的安全状态。

不过，在AI防御开始之前，人工智能网络攻击也不能被忽视。

卷积神经网络之卷积计算、作用与思想

demi 在周五, 11/09/2018 - 13:45 提交

卷积运算与相关运算

在计算机视觉领域，卷积核、滤波器通常为较小尺寸的矩阵，比如 3 × 3 、5 × 5 等，数字图像是相对较大尺寸的2维（多维）矩阵（张量），图像卷积运算与相关运算的关系如下图所示（图片来自链接），其中 F 为滤波器，X 为图像，O 为结果。

相关是将滤波器在图像上滑动，对应位置相乘求和；卷积则先将滤波器旋转180度（行列均对称翻转），然后使用旋转后的滤波器进行相关运算。两者在计算方式上可以等价，有时为了简化，虽然名义上说是“卷积”，但实际实现时是相关。

Gartner公布十大战略物联网技术和趋势

demi 在周五, 11/09/2018 - 11:37 提交

Gartner今天强调了最重要的几大战略物联网（IoT）技术趋势，并称这些趋势将推动2018年至2023年期间的数字业务创新。

Gartner研究副总裁Nick Jones表示：“物联网将继续为未来十年的数字业务创新提供新的机遇，其中很多创新将通过新技术或改进技术实现。那些掌握了创新物联网趋势的CIO们才有机会在其业务中领导数字化创新。”

此外，CIO们应该确保他们拥有必要的技能和合作伙伴，以支持关键的新兴物联网趋势和技术，因为到2023年CIO们负责的端点数量将是今年的3倍多。

Gartner列出了10项最具战略意义的物联网技术和趋势，这些技术和趋势将实现新的收入流和业务模式，以及新的体验和关系：

趋势1：人工智能（AI）

Gartner预测，到2019年使用中的联网事物将达到142亿个，到2021年将达到250亿个，这都会产生海量的数据。Jones说：“数据是物联网的动力，推动着企业组织从中获取洞察以实现长期成功。人工智能将被应用于广泛的物联网信息中，包括视频、静止图像、语音、网络流量活动和传感器数据等。”

机器人视觉系统包括哪些关键技术？

demi 在周五, 11/09/2018 - 10:34 提交

机器人视觉系统是指用计算机来实现人的视觉功能，也就是用计算机来实现对客观的三维世界的识别。人类接收的信息70%以上来自视觉，人类视觉为人类提供了关于周围环境最详细可靠的信息。

人类视觉所具有的强大功能和完美的信息处理方式引起了智能研究者的极大兴趣，人们希望以生物视觉为蓝本研究一个人工视觉系统用于机器人中，期望机器人拥有类似人类感受环境的能力。机器人要对外部世界的信息进行感知，就要依靠各种传感器。就像人类一样，在机器人的众多感知传感器中，视觉系统提供了大部分机器人所需的外部世界信息。因此视觉系统在机器人技术中具有重要的作用。

依据视觉传感器的数量和特性，目前主流的移动机器人视觉系统有单目视觉、双目立体视觉、多目视觉和全景视觉等。

单目视觉

单目视觉系统只使用一个视觉传感器。单目视觉系统在成像过程中由于从三维客观世界投影到N维图像上，从而损失了深度信息，这是此类视觉系统的主要缺点( 尽管如此，单目视觉系统由于结构简单、算法成熟且计算量较小，在自主移动机器人中已得到广泛应用，如用于目标跟踪、基于单目特征的室内定位导航等。同时，单目视觉是其他类型视觉系统的基础，如双目立体视觉、多目视觉等都是在单目视觉系统的基础上，通过附加其他手段和措施而实现的。

机器学习（九）——逻辑回归与SVM区别

demi 在周五, 11/09/2018 - 09:46 提交

1、LR和SVM有什么相同点

（1）都是监督分类算法，判别模型；

（2）LR和SVM都可以处理分类问题，且一般都用于处理线性二分类问题（在改进的情况下可以处理多分类问题）；

（3）两个方法都可以增加不同的正则化项，如L1、L2等等。所以在很多实验中，两种算法的结果是很接近的。

2、LR和SVM有什么不同点

（1）本质上是其loss function不同；

区别在于逻辑回归采用的是Logistical Loss，SVM采用的是hinge loss.这两个损失函数的目的都是增加对分类影响较大的数据点的权重，减少与分类关系较小的数据点的权重。

逻辑回归损失函数：
机器学习（九）——逻辑回归与SVM区别