demi的博客 | 电子创新网 Imgtec 社区

机器学习常用评估指标的前世今生

demi 在周日, 09/30/2018 - 15:37 提交

在机器学习中，性能指标（Metrics）是衡量一个模型好坏的关键，通过衡量模型输出y_predict和y_true之间的某种“距离”得出的。

性能指标往往使我们做模型时的最终目标，如准确率，召回率，敏感度等等，但是性能指标常常因为不可微分，无法作为优化的loss函数，因此采用如cross-entropy，rmse等“距离”可微函数作为优化目标，以期待在loss函数降低的时候，能够提高性能指标。而最终目标的性能指标则作为模型训练过程中，作为验证集做决定(early stoping或model selection)的主要依据，与训练结束后评估本次训练出的模型好坏的重要标准。

在机器学习的比赛中，有部分比赛也是用metrics作为排名的依据（当然也有使用loss排名）。

在使用机器学习算法的过程中，针对不同的场景需要不同的评价指标，常用的机器学习算法包括分类，回归，聚类等几大类型，在这里对常用的指标进行一个简单的总结，小编总结了前人的很多博客，知乎等，方便自己学习。当然，需要的同学们也可以看一下。

一，分类

自动驾驶技术之——无人驾驶中的CAN总线

demi 在周日, 09/30/2018 - 14:24 提交

CAN总线在整个无人驾驶系统中有着十分重要的作用。除了在VCU信号需要通过CAN总线进行传输外，无人车上的某些传感器（如雷达、Mobileye）的信号传递也是通过CAN实现的。

前言

本文主要内容是——无人驾驶中的CAN（Controller Area Network ）总线。

CAN总线在整个无人驾驶系统中有着十分重要的作用。除了在VCU信号需要通过CAN总线进行传输外，无人车上的某些传感器（如雷达、Mobileye）的信号传递也是通过CAN实现的。

我在无人驾驶，个人如何研究？中提到过

实现一个无人驾驶系统，会有几个层级：感知层 → 融合层 → 规划层 → 控制层更具体一点为：传感器层 → 驱动层 → 信息融合层 → 决策规划层 → 底层控制层

“传感器层”在之前的分享中已经介绍过了，这次主要介绍的是“驱动层”相关的内容。

正文

如何选择适合你的无线通信方式？

demi 在周日, 09/30/2018 - 11:43 提交

你是否还在为无线通信选用NB-IoT还是LoRa而困扰？搞不清楚ZigBee和LoRa的优势区别，不明白到底什么场合适用Wi-Fi？看完这篇文章你就懂了。

在万物互联的时代里，越来越多的物体将被连接到互联网，打通端到端、端到云的连接。这些连接，我们可采用多种通信链路予以实现。在智能物联应用上，工程师经常会困惑NB-IoT/LoRa/ZigBee/Wi-Fi等无线连接方式，到底哪一种，才是最合适的？哪一种才能让项目开发事半功倍？

以下，为大家列出在选择无线通信方式时的考虑大纲。

一、传输基础篇

距离：遮挡、空旷情况下节点到网关的距离。
速率：传输数据量有多大？
实时性：能接受的响应延时？
功耗：电池寿命，能效，可能需要连接交流电。
容量：一定范围内联网节点、设备的数量。
环境：工厂中的危险环境、暴露在天气中的室外环境、来自电子设备的噪声或电磁干扰等。
通信方式：单向还是双向通信。

二、附加功能篇

语音识别算法的现状

demi 在周日, 09/30/2018 - 10:44 提交

目前的语音识别算法：卷积神经网络、深度学习神经网络、BP神经网络、RBF神经网络、模糊聚类神经网络、改进的T-S模糊神经网络、循环神经网络、小波神经网络、混沌神经网络、小波混沌神经网络、神经网络和遗传算法、动态优化神经网络、K均值和神经网络集成、HMM与自组织神经网络的结合、正交基函数对向传播过程神经网络、HMM和新型前馈型神经网络、特征空间随机映射、SVM多类分类算法、特征参数归一化、多频带谱减法、独立感知理论、分段模糊聚类算法VQ-HMM、优化的竞争算法、双高斯GMM特征参数、MFCC和GMM、MFCCs和PNN、SBC和SMM、MEL倒谱系数和矢量量化、DTW、LPCC和MFCC、隐马尔科夫模型HMM。

由于BP算法在神经网络的层数增多时容易陷入局部最优的困境，也很容易产生过拟合的问题。20世纪90年代,各种各样的浅层机器学习模型相继被提出,如支撑向量机(Support Vector Machines, SVM)、Boosting、最大熵方法(如 Logistic Regression, LR)等。这些模型具有高效的学习算法,且不存在局部最优的问题,在理论分析与实际应用中都获得了巨大的成功。相比之下,MLP的训练需要很多经验和技巧,多层前馈神经网络的研究逐渐变得冷清。

[收藏]图像处理的基本知识

demi 在周日, 09/30/2018 - 09:31 提交

调色板
调色板（Palette）也叫颜色查找表，是指在16色（每个像素4个bit，总共有16种颜色）或256色（每个像素8个bit，即一个字节，总共有256种颜色）显示系统中由图像中出现最频繁的16种或256种颜色所组成的查找表。对这些颜色按4位(16色)或8位(256色)，即0-15或0-255进行编号，每一个编号(索引值)代表R，G，B，3个分量24位的颜色值。使用调色板的图像叫做调色板图像。对于调色板图像而言，它们的像素值并不是颜色值，而是颜色在调色板查找表中的索引号。

图像的颜色处理
自然界的颜色可以简单地分为黑白色(包括灰度级)和彩色两种。
彩色图像处理分为3个主要处理领域，即真彩色，假彩色和伪彩色处理领域。在真彩色处理中，被处理的图像一般从真彩色传感器中获得，例如彩色摄像头或彩色扫描仪；假彩色处理时一种尽量接近真彩色的人工彩色处理技术；伪彩色处理时将彩色分配给某种灰度(强度或强度范围)，以增强辨识能力。

1、将256色位图转换为灰度图

从人工智能到机器学习

demi 在周六, 09/29/2018 - 16:37 提交

一、机器学习的背景

大家都说人工智能是综合的学科，而机器学习就是人工智能的大脑。它通过对数据的处理，不断地变得更好和更强，做出各种各样的判断和决策。

人工智能、机器学习、深度学习，这三者是什么关系？

我们可以参照下面这张图：

机器学习是实现人工智能的一种方法，机器学习有很多的细分领域，其中有一个领域是人工神经网络，而深度学习是人工神经网络这个领域的一个分支。

二、什么是机器学习呢？

做机器学习，大部分工作其实是编程。通俗地讲：机器学习是一种计算机程序，可以从现有的经验中学习如何完成某项任务，并且随着经验的增加，性能也随之提升。

三、机器学习有哪些分类？

【计算机视觉】SIFT中LoG和DoG比较

demi 在周六, 09/29/2018 - 13:59 提交

在实际计算时，三种方法计算的金字塔组数noctaves，尺度空间坐标σ，以及每组金字塔内的层数S是一样的。同时，假设图像为640*480的标准图像。

金字塔层数：

其中o_min = 0，对于分辨率为640*480的图像N=5。每组金字塔内图像数：S=3，即在做极值检测时使用金子塔内中间3张图像。对于LoG每组金字塔内有S+2张图像（S=-1，0,1,2,3），需要做S+1次高斯模糊操作（后一张图像由前一张做高斯模糊得到）；而DoG每组金字塔有S+3张高斯图像，得到S+2张DoG图像。尺度空间系数：

深度学习入门必须理解这25个概念！

demi 在周六, 09/29/2018 - 11:48 提交

人工智能，深度学习，机器学习—无论你在做什么，如果你对它不是很了解的话—去学习它。否则的话不用三年你就跟不上时代的潮流了。 ——马克.库班

马克.库班的这个观点可能听起来很极端——但是它所传达的信息是完全正确的！我们正处于一场革命的旋涡之中——一场由大数据和计算能力引起的革命。

只需要一分钟，我们来想象一下，在20世纪初，如果一个人不了解电力，他/她会觉得如何？你会习惯于以某种特定的方式来做事情，日复一日，年复一年，而你周围的一切事情都在发生变化，一件需要很多人才能完成的事情仅依靠一个人和电力就可以轻松搞定，而我们今天正以机器学习和深度学习的方式在经历一场相似的旅程。

所以，如果你还没有探索或理解深度学习的神奇力量——那你应该从今天就开始进入这一领域。

谁应该读这篇文章？

如果你是一个想学习或理解深度学习的人，这篇文章是为你量身定做的。在本文中，我将介绍深度学习中常用的各种术语。

揭开机器学习的面纱

demi 在周六, 09/29/2018 - 10:08 提交

你周围的人是否都在谈论着“机器学习”？而你是否也听说过一些算法技术却仍旧缺乏一个全局的认识？本文也许就是一个好的起点……

智力的新纪元

在科学界，机器学习是目前很热门的话题。通过把计算机和人类的能力相结合，一些相当复杂甚至是难以想象的问题正在被逐个突破。

如今的机器可以更容易地处理不断产生的大量数据，也能够对复杂的科学发现进行破译。另一方面，研究人员已经承认机器学习具有用于广泛领域的潜力，并且最终可以付诸实践。

当开始着手研究机器学习，我们会发现这其中很多的算法技术对于统计学家、工程师、程序员、数学家和金融工程师而言也许并不陌生。这是因为这些算法技术实际上已经被研究很多年了。“机器学习”是一个相对而言的新名词，但对于数据科学家而言这并不是一个完全陌生的领域。

本文汇总了原作者在研究初时遇到的一些有趣的实例，从而有助于理解机器学习的相关内容是如何联系在一起，并列出其知识体系各部分之间的不同之处，最终针对现有的项目，选择最佳的方案。

虽然本文并没有提出什么新的观点，甚至算不上专业，但原作者希望本文可以帮助那些对入门机器学习仍有疑惑的人。

人工智能的利与弊

demi 在周六, 09/29/2018 - 09:28 提交

技术是人类发展和成长的重要组成部分。人工智能( AI )就是这样一种技术，它正在大肆炒作。随着技术成为我们日常生活的一部分，人工智能已成为辩论和讨论的主题，科技专家认为这是一种福音，对某些人来说，这是一场灾难。尽管如此，我们仍然不确定人工智能的未来——人工智能是威胁还是福音？

花几分钟时间分析一下，看看你对人工智能（AI）应用的依赖程度如何？

我们肯定你听说过苹果的虚拟助理Siri，你还经常使用谷歌的语音搜索功能吗，好用吗？这两个应用程序都使用了人工智能技术，可以让我们的生活更轻松。无论是拨打电话还是设置提醒，AI都在为更高效的生活铺平道路。

让我们深入研究一下，看看人工智能的好处和风险。

人工智能的优点如下：

减少出错机会

由于机器所做的决策是基于先前的数据记录和算法组合，因此出现错误的机会减少了。这是一项成就，因为解决了需要进行计算困难的复杂问题，可以在没有任何误差范围的情况下完成。