demi的博客

为何GPU可以用于加速人工智能或者机器学习的计算速度?

一、Why GPU

其实GPU计算比CPU并不是“效果好”,而是“速度快”。

计算就是计算,数学上都是一样的,1+1用什么算都是2,CPU算神经网络也是可以的,算出来的神经网络放到实际应用中效果也很好,只不过速度会很慢罢了。

GPU的起源

GPU全称叫做graphics processing unit,图形处理器,顾名思义就是处理图形的。

电脑显示器上显示的图像,在显示在显示器上之前,要经过一些列处理,这个过程有个专有的名词叫“渲染”。以前的计算机上没有GPU,渲染就是CPU负责的。渲染是个什么操作呢,其实就是做了一系列图形的计算,但这些计算往往非常耗时,占用了CPU的一大部分时间。而CPU还要处理计算机器许多其他任务。因此就专门针对图形处理的这些操作设计了一种处理器,也就是GPU。这样CPU就可以从繁重的图形计算中解脱出来。

由于GPU是专门为了渲染设计的,那么他也就只能做渲染的那些事情。

图像分割网络FCN原理详解

一、全卷积网络(FCN)

卷积神经网络从图像分类到到对象检测、实例分割、到图像语义分割、是卷积特征提取从粗糙输出到精炼输出的不断升级,基于卷积神经网络的全卷积分割网络FCN是像素级别的图像语义分割网络,相比以前传统的图像分割方法,基于卷积神经网络的分割更加的精准,适应性更强。

为了了解全卷积网络,我们必须他与普通CNN网络的区别:

1.1 CNN网络

通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量。以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务,因为它们最后都期望得到整个输入图像的一个数值描述(概率),比如AlexNet的ImageNet模型输出一个1000维的向量表示输入图像属于每一类的概率(softmax归一化)。

  •   举例:下图中的猫, 输入AlexNet, 得到一个长为1000的输出向量, 表示输入图像属于每一类的概率, 其中在“tabby cat”这一类统计概率最高(如下图)。

详解5G领域最关键的十大技术

提到5G,很多人的第一印象就是它的网络速度快、延时性低、带宽大,没错,这就是5G时代的特点!5G作为第五代移动通信网络,其峰值理论传输速度可达每秒数十Gb,这比4G网络的传输速度快数百倍,整部超高画质电影可在1秒之内下载完成。随着5G技术的诞生,用智能终端分享3D电影、游戏以及超高画质(UHD)节目的时代已向我们走来。5G作为未来几年的主流通讯技术,正在向我们招手,2019年将会有部分的地区实现5G网络全覆盖,值得期待。可是,您知道5G的关键技术有哪些?它们如何实现的,本文带您来熟悉一下。

十、网络切片技术

就是把运营商的物理网络切分成多个虚拟网络,每个网络适应不同的服务需求,这可以通过时延、带宽、安全性、可靠性来划分不同的网络,以适应不同的场景。通过网络切片技术在一个独立的物理网络上切分出多个逻辑网络,从而避免了为每一个服务建设一个专用的物理网络,这样可以大大节省部署的成本。

九、高频段传输

Unity项目开发过程中常见的问题,你遇到过吗?

作者: 陈嘉栋

最近看到有朋友问一个unity游戏开发团队,需要掌握哪些知识之类的问题。事实上Unity引擎是一个很灵活的引擎,根据团队开发游戏类型的不同,对人员的要求也有差异,所以不能一概而论。但是,一些在Unity项目开发过程中常常会遇到的问题还是可以总结一下的。

下面我就来聊聊实际工作中,一个项目组可能会遇到的问题吧。

0x01.项目前期规划时的问题

这里指的不是策划的需求或者游戏玩法的计划,而是作为一个Unity项目我们需要在一开始明确并制定好的规范和标准。作为一个Unity项目或软件项目,这部分是很重要的,因为项目早期的规划随着项目的开发时间越久,就越难以修改。

对支持的最低机型不明确
作为一个Unity项目,我们首先要明确我们所需要支持的最低设备标准。并且项目组要有这样的设备,以供开发和QA团队使用。
否则,对项目的优化将无从谈起。

简述三种常见3D音频格式,及VR中Ambisonics格式的重要性

3D音频是为VR内容提供沉浸感和临场感的一个关键因素,所以我们有必要理解3D音频格式,以及它们对音频内容创建和渲染的应用。

下面我们来看一下三种3D音频格式,并分析Ambisonics对VR音频的重要性。

1 . 多声道

在基于声道的声音表达中,信息单元是扬声器。每个声道与扬声器相关联,系统在几个扬声器上混合各种声道来实现声音表达。声道越多,空间音效感就越强。基于声道的声音表达是过去50年,甚至更久远时所采用的传统声音表达方式。立体声,5.1,7.1格式是基于声道的水平表示。通过增加额外的过顶扬声器可以实现3D,如11.1格式(在7.1声道的基础上再增加4个天花板扬声器)。

多声道音频表达的一个主要缺点是,它依赖于扬声器设置,并且每个设置类型需要一个混合,而基于Object和Ambisonics的内容则独立于扬声器设置。

2 . 基于Object的声音表达

自动驾驶汽车开发中雷达选用原则的研究

自动驾驶汽车开发中,激光雷达理应是不能少的器件。但是车规的激光雷达,外国品牌在15万元的价位,国产也在5万的价位上。业内人士一看,就知道,如果激光雷达,成本不下降到1万以下,中国自动驾驶汽车要上市是不可能的。目前的产品基本上是,研究层面的事情,离上市还远得很。好在国内激光雷达生产厂家越来越多,水平越来越高,成本下降的空间也是越来越大。整车厂自动驾驶汽车开发工程师,对激光雷达,做深入了解的要求也是越来越高。下面做系统介绍,供同行参考。

对激光雷达的认识

普通人对雷达的认识基本上源于电影的画面(图1),雷达可以发现敌人飞机。

神经网络纹理合成和损失函数风格转移

稳定可控的神经网络纹理合成和采用直方图损失函数的风格转移
Stable and Controllable Neural Texture Synthesis and Style Transfer Using Histogram Losses

摘要

最近,出现了用卷积神经网络做纹理合成和风格转移的方法。这些方法令人激动,它们可以生成最新最好的质量。然而,我们发现这些方法在纹理质量,稳定性,参数调整,无需用户控制上面都有一些限制。本文提供了卷积神经网络的多尺度合成方法可以改善这些问题。我们对之前很多方法的不稳定的来源做了数学解释。我们使用直方图损失函数合成纹理改善这些不稳定性,更好地统计概率上匹配这些实例。我们还展示了如何在我们的多尺度框架中整合定位后的风格损失。这些损失函数可改善大特征的质量,增强内容和风格的分离,提供了艺术性控制,比如绘画。我们还展示了我们的方法对质量进行改进,在很少迭代中收敛,优化过程中更稳定。

一文盘点10大连接数百亿终端的无线网络技术

互联网行业发展到今天,人们生活的便利度已经被极大的提高。在家有Wi-Fi,出门有4G,定位有GPS等等,似乎网络已经成为继衣食住行之后的又一重要组成部分,覆盖生活的方方面面,但在万物互联时代,网络连接技术需要进一步迭代。

物联网架构一般被分为感知层、网络层、平台层和应用层,其中网络层处于物联网生态系统的枢纽位置,在物联网设备连接方面扮演着举足轻重的作用。物联网的最终目标仍然是服务于人,因此,具有更高便携性的无线网络连接技术得到了更广泛的关注。在互联网时代已经发展出一大批无线网络技术,面向万物互联,无线网络连接技术得到了更好的发展。

目前,无线网络连接技术按照传输距离远近可分为短距离无线连接技术和长距离无线连接技术。下面分别列举了各自的5种主要技术,包括蓝牙,Wi-Fi,NFC,ZigBee,UWB以及GPRS,5G,NB-IoT,LoRa,全球卫星导航系统等。

OpenGL中的深度、深度缓存、深度测试

1、深度

所谓深度,就是在openGL坐标系中,像素点Z坐标距离摄像机的距离。摄像机可能放在坐标系的任何位置,那么,就不能简单的说Z数值越大或越小,就是越靠近摄像机。

2、深度缓冲区

深度缓冲区原理就是把一个距离观察平面(近裁剪面)的深度值(或距离)与窗口中的每个像素相关联。

首先,使用glClear(GL_DEPTH_BUFFER_BIT),把所有像素的深度值设置为最大值(一般是远裁剪面)。

然后,在场景中以任意次序绘制所有物体。硬件或者软件所执行的图形计算把每一个绘制表面转换为窗口上一些像素的集合,此时并不考虑是否被其他物体遮挡。

其次,OpenGL会计算这些表面和观察平面的距离。如果启用了深度缓冲区,在绘制每个像素之前,OpenGL会把它的深度值和已经存储在这个像素的深度值进行比较。新像素深度值<原先像素深度值,则新像素值会取代原先的;反之,新像素值被遮挡,他颜色值和深度将被丢弃。

GPU渲染流水线

GPU的渲染流水线的主要任务是完成3D模型到图像的渲染(render)工作。常用的图形学API编程模型中的渲染过程被分为几个可以并行处理的阶段,分别由GPU中渲染流水线的不同单元进行处理。GPU输入的模型是数据结构(或语言)定义的对三维物体的描述,包括几何、方向、物体表面材质以及光源所在位置等;而GPU输出的图像则是从观察点对3D场景观测到的二维图像。在GPU渲染流水线的不同阶段,需要处理的对象分别是顶点(vertex)、几何图元(primitive)、片元(fragment)、像素(pixel)。

如图1-6所示,典型的渲染过程可以分为以下几个阶段:

1.顶点生成

图形学API用简单的图元(点、线、三角形)表示物体表面。每个顶点除了(x,y,z)三维坐标属性外还有应用程序自定义属性,例如位置、颜色、标准向量等。

2.顶点处理