demi的博客

理清光线追踪发射主光线的细节和概念

光线追踪是图形学领域里最为著名的一种技术,其中首要的一步是视点(相机,眼睛)穿过像素中心,发射一条射线,也就是主光线(次级光线指的是从物体表面反射或折射等发出的光线)。这一步看起来比较简单,但仍然涉及到一些细节和概念需要理清。

我系统的学习这些东西是从renderman规范开始的,看的第一本书是advanced renderman,这本比较难,我更推荐看An Introduction to Ray Tracing (1989)。

开始正题。首先,要搞清楚fov角,advanced renderman上会讲到焦距,讲的非常细致深入,如果要深挖可以看书,我就不谈了(毕竟我也不记得了)。相机所看到的三维场景是一个视锥体,也叫平截头体,如下图:

直方图均衡(HE)与局部色调映射(LTM)

直方图均衡(Histogram Equalization)是图像处理中一个十分基础的概念,具有调整图像灰度,增强对比度的作用。

限制对比度自适应直方图均衡(Contrast Limited Adaptive Histogram Equalization,CLAHE),关于该算法的中文原理性描述可以参考网址:http://www.cnblogs.com/Imageshop/archive/2013/04/07/3006334.html

下面我按照自己的理解来介绍一下CLAHE算法:

自适应直方图均衡(AHE)算法,对于图像中存在明显比其他区域亮或者暗的地方时,普通的直方图均衡算法就不能将该处的细节信息描述出来。AHE算法通过在当前处理像素周边的一个矩形区域内进行直方图均衡,来达到扩大局部对比度,显示平滑区域细节的作用。

AHE算法的2个属性:1、AHE算法处理的局部领域,矩形领域小,局部对比度强,矩形领域大,局部对比度弱。2、如果矩形区域内的图像块信息比较平坦,灰度接近,其灰度直方图呈尖状,在直方图均衡的过程中就可能会出现过度放大噪声的情况。

Gartner发布10大物联网策略趋势

国际研调机构Gartner公布2018至2023年引领数字企业创新的10大物联网(IOT)策略技术趋势。副总裁暨分析师Nick Jones指出,未来10年,物联网将带动数字企业创新的商机,能够掌握物联网创新趋势的信息官,将有机会带领企业迈向数字创新。

此外,他指出,信息官也应确保企业拥有必要的知识和合作伙伴来支持重要的物联网新兴趋势和技术,因为到了2023年,信息官需掌管的平均终端装置数量将是目前的3倍以上。

列出10项IoT策略技术趋势:

第一:AI人工智能。
该机构预测,2019年全球连网对象数量将达142亿美元,并在2021年将达250亿美元,因此将产生极大量的数据。未来AI将被用来处理各种IoT数据,包括影片、静态影像、语音、网络流量与传感器数据。

第二:IoT的社会、法律与道德面向;

第三:信息经济学与数据中介(Data Broking)。
预估至2023年,买卖IoT数据将成为许多IoT系统必要的一环,信息官必须教育组织有关数据中介的相关风险及商机,针对该领域订定相关IT政策,并为组织内其他单位提供咨询。

深度学习基础网络 ResNet

Highway Networks

论文地址 : https://arxiv.org/abs/1505.00387 [cs.LG] (ICML 2015),
全文:Training Very Deep Networks( https://arxiv.org/abs/1507.06228 )

基于梯度下降的算法在网络层数增加时训练越来越困难(并非是梯度消失的问题,因为batch norm解决梯度消失问题).论文受 RNN 中的 LSTM、GRU 的 gate 机制的启发,去掉每一层循环的序列输入,去掉 reset gate (不需要遗忘历史信息),仍使用 gate 控制前一次输出与当前层激活函数之后的输出的融合比例,从而提出了highway networks,加入了称为 information high-ways的shortcut连接,使得信息可以跨层直接原样传递.这使得网络深度理论上几乎可以是无限.

机器学习之特征工程、特征选择、归一化方法

1、特征选择

特征选择也被称为变量选择和属性选择,它能够自动地选择数据中目标问题最为相关的属性。是在模型构建时中选择相关特征子集的过程。

特征选择与降维不同。虽说这两种方法都是要减少数据集中的特征数量,但降维相当于对所有特征进行了重新组合,而特征选择仅仅是保留或丢弃某些特征,而不改变特征本身。
降维常见的方法有PCA,SVD,萨蒙映射等,特征选择是丢弃作用小的特征。

为什么要做特征选择?

在有限的样本数目下,用大量的特征来设计分类器计算开销太大而且分类性能差。通过特征选取,删选掉冗余重复的和不相关的特征来进一步降维,获取尽可能小的特征子集,模型仅需少量的样本就可以得到较高的预测准确率。特征选择可以移除那些重复冗余、无关的特征,利于构建复杂度更低、解释性更强的模型。  

1、去除冗余和不相关的特征,减少了特征维度,有利于提高模型的预测能力,构建效率更高的模型。
2、更好地理解数据生成的过程,模型的解释性更强。

特征选择方法有很多,一般分为三类:

浅谈物联网管理平台的优势与应用

物联网是在计算机互联网的基础上,利用RFID、无线数据通信等技术,构造一个覆盖世界上万事万物的“Internet of Things”。在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。其实质是利用射频自动识别(RFID)技术,通过计算机互联网实现物品(商品)的自动识别和信息的互联与共享。比如超市里的付款系统,目前的超市里都是有专门的工作人员核算顾客的消费量,而利用物联网则能实现付款机对货物的自动核算功能,大大提高了购买效率。

那么物联网综合管控平台系统又有哪些优势呢?

1、一点接入,全网服务:提供政企公司或各省公司一点进行业务受理,分省出卡的业务开通,各配合省根据客户需求进行卡的制作、配号和销售,直接为客户提供业务服务和网络服务,满足客户“一点拿卡”、“一站式服务”需求,避免客户与多个省进行业务对接,且无省间漫游结算,特别适合于全网业务应用的行业客户。  

2、丰富的码号资源:拥有13位以10648开头的物联网专用号段和11位以14765开头的物联网专用号段,总容量达一亿以上,充分满足用户大数量码号需求。  

教你如何挑选深度学习GPU

随着硬件的更新换代,越来越多的机器学习从业者又开始面临选择 GPU 的难题。正如我们所知,机器学习的成功与否很大程度上取决于硬件的承载能力。在今年 5 月,我在组装自己的深度学习机器时对市面上的所有 GPU 进行了评测。而在本文中,我们将更加深入地探讨:

GPU + 深度学习

深度学习(DL)是机器学习(ML)的一个分支。深度学习使用神经网络来解决问题。神经网络的优点之一是自行寻找数据(特征)模式。这和以前告诉算法需要找什么不一样。但是,通常这意味着该模型从空白状态开始(除非使用迁移学习)。为了从头捕捉数据的本质/模式,神经网络需要处理大量信息。通常有两种处理方式:使用 CPU 或 GPU。

计算机的主要计算模块是中央处理器(CPU),CPU 的设计目的是在少量数据上执行快速计算。在 CPU 上添加数倍的数字非常快,但是在大量数据上进行计算就会很慢。如,几十、几百或几千次矩阵乘法。在表象背后,深度学习多由矩阵乘法之类的操作组成。

简单易懂的讲解深度学习(入门系列之四)

在前一个小节中,简单地谈了谈什么是“M-P神经元模型”,顺便用生活中生动的小案例,把激活函数和卷积函数的概念撸了一遍。下笔之处,尽显“神经”。当然这里所谓的“神经”,是说我们把不同领域的知识,以天马行空地方式,揉和在一起,协同提升认知水平。其实,这不也正是深度学习的前沿方向之一——“迁移学习(Multi-Task and Transfer Learning)”要干的事情吗?

下面,继续“神经”下去,首先聊聊机器学习的三大分支,然后以“中庸之道”来看机器学习的发展方向。

4.1 机器学习的三个层次

在我们小时候,大概都学习过《三字经》,其中有句“性相近,习相远。”说的就是,“人们生下来的时候,性情都差不多,但由于后天的学习环境不一样,性情也就有了千差万别。”

其实,这句话用在机器学习领域,上面的论述也是大致适用的。机器学习的学习对象是数据,数据是否有标签,就是机器学习所处的“环境”,“环境”不一样,其表现出来的“性情”也有所不同,大致可分为三类:

智能网联汽车信息安全建设十大常见误区

过去的二十年,汽车行业把大量的数字化技术应用在协同工作、设计开发、销售及服务等方面,因此信息安全建设过去几乎没有围绕汽车实施。同时由于生产环境和物理环境的相对封闭,我们也看到国内大量整车厂针对传统信息安全建设的缺位。信息安全不是个新话题,但是在汽车行业开始被重视并且实践,是近两年才开始的。

近年通过大量的走访、调研,我们发现汽车行业在智能网联汽车信息安全建设过程中,目前存在大量的建设误区,导致成本及资源的浪费,未来甚至可能埋下新的安全隐患。

因此我们总结了十大常见误区,供行业管理者参考:

1. 信息安全战略不清晰

智能网联汽车信息安全与车辆主被动安全不同,需要同时考虑人员、策略、技术等多维度的风险控制。而风险战略自上而下、由内而外都需要兼顾,需要调配供应链、IT、法务、风控、电子电器、车内网络甚至销售运维等多个部门,需要项目参与人都拥有相当的风险控制意识,需要在车辆的整个生命周期都贯彻风险管理措施……因此信息安全战略的缺失或者不完善,很大程度上会影响整车企业信息安全建设的走向。

自动驾驶中常用的四类机器学习算法

机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据融合(如激光雷达、雷达、摄像头或物联网),评估驾驶员状况或为驾驶场景分类等。在KDnuggets网站发表的一篇文章中,作者Savaram Ravindra将自动驾驶中机器学习算法主要分为四类,即决策矩阵算法、聚类算法、模式识别算法和回归算法。我们跟他一起看看,这些算法都是怎样应用的。

算法概览

我们先设想这样一个自动驾驶场景——汽车的信息娱乐系统接收传感器数据融合系统的信息,如果系统发现司机身体有恙,会指导无人车开往附近的医院。

这项应用以机器学习为基础,能识别司机的语音、行为,进行语言翻译等。所有这些算法可以分为两类:监督学习和无监督学习,二者的区别在它们学习的方法。

监督学习算法利用训练数据集学习,并会坚持学到达到所要求的置信度(误差的最小概率)。监督学习算法可分为回归、分类和异常检测或维度缩减问题。