GPU

今天,Imagination在北京举行了一场小型媒体交流会,Imagination CEO李力游博士、副总裁兼中国区总经理刘国军、中国市场和业务拓展总监柯川、市场营销与传播副总裁David Harold及一众高管出席了交流会。

9月23日,中国的私人资本Canyon Bridge以5.5亿英镑(约49亿元人民币)收购了Imagination,溢价约为42%。随即在今年4月,紫光集团前联席总裁李力游博士宣布加入Imagination,正式接任CEO一职。

对话Imagination CEO李力游:大力加码人工智能 现场叫板高通
(Imagination市场营销与传播副总裁David Harold)

在交流会上,李力游博士直白地说,自己最感兴趣的是人工智能,接任Imagination CEO一职的主要原因就是希望通过GPU把AI做好。

一、布局六大主要市场:AI为重点领域

GPU学习笔记

Graphics Processing Unit(GPU),即可编程图形处理单元, 通常也称之为可编程图形硬件。

由于 GPU 具有高并行结构(highly parallel structure),所以 GPU 在处理图形数据和复杂算法方面拥有比 CPU 更高的效率。图 1 GPU VS CPU 展示了 GPU 和 CPU 在结构上的差异,CPU 大部分面积为控制器和寄存器,与之相比,GPU 拥有更多的 ALU(Arithmetic Logic Unit,逻辑运算单元)用于数据处理,而非数据高速缓存和流控制,这样的结构适合对密集型数据进行并行处理。CPU 执行计算任务时,一个时刻只处理一个数据,不存在真正意义上的并行,而 GPU 具有多个处理器核,在一个时刻可以并行处理多个数据。

GPU学习笔记

三维渲染中的裁剪总汇

裁剪是个很大的概念,裁剪包括了视锥体裁剪(应用程序阶段)、视口裁剪(图元装配——几何阶段的最后一步)、背面剔除(光栅化阶段)、遮挡剔除(光栅化阶段)。

iOS构建流畅的交互界面--CPU,GPU资源消耗的原因和解决方案

CPU资源消耗的原因和解决方案

对象创建

轻量对象代替重量对象
* 不需要响应触摸事件的控件:CALayer显示
* 对象不涉及UI操作,则尽量放到后台线程创建
* 包含有CALayer的控件只能在主线程创建和操作
* 通过Storyboard 创建视图对象时,其资源消耗会比直接通过代码创建对象要大非常多,在性能敏感的界面里,storyboard不是一个好的技术选择
* 尽量推迟对象创建的时间,并把对象的创建分散到多个任务中去。
* 对象的复用代价比释放,创建新对象要小,这类对象应当尽量放到一个缓存池里复用

对象调整

* CALayer:CALayer内部并没有属性,当调用属性方法时,它内部是通过运行时resolveInstanceMethod为对象临时添加一个方法,并把对应属性值保存到内部的一个Dictionary里,同时还会通知delegate,创建动画等等,非常消耗资源。
* UIView的关于显示相关的属性(frame/bound/transform)等实际上都是CALayer属性映射来的,所以对UIView的这些属性进行调整时,消耗的资源要远大于一般的属性,所以,尽量减少不必要的属性修改

GPU渲染之OpenGL的GPU管线

GPU渲染流水线,是硬件真正体现渲染概念的操作过程,也是最终将图元画到2D屏幕上的阶段。GPU管线涵盖了渲染流程的几何阶段和光栅化阶段,但对开发者而言,只有对顶点和片段着色器有可编程控制权,其他一律不可编程。如下图:

GPU渲染之OpenGL的GPU管线

简单总结GPU管线,这阶段中主要是对图元进行操作。首先,将由应用阶段加载到显存中的顶点数据(由drawCall指定后)作为输入传递给顶点着色器。接着,顶点着色器首先对图元的每个顶点设置模型视图变换及投影变换(即右乘MVP矩阵),然后将变换后的顶点按照摄像机视椎体定义(即透视投影,或正投影)进行裁剪,将不在视野内的顶点去掉并剔除某些三角面片。最后到几何阶段的屏幕映射,负责把修改过的图元的坐标转换到屏幕坐标系中(即投影到屏幕上)。

步入计算多元化时代,异构计算为什么发展空间巨大?

在互联网行业,随着信息化的普及,数据量的暴增使得人们对存储空间又有了新要求,同时,机器学习、人工智能、无人驾驶、工业仿真等领域的崛起,使得通用CPU在处理海量计算、海量数据/图片时遇到越来越多的性能瓶颈,如并行度不高、带宽不够、时延高等。

为了应对计算多元化的需求,越来越多的场景开始引入GPU、FPGA等硬件进行加速,异构计算应运而生。异构计算(Heterogeneous Computing),主要指不同类型的指令集和体系架构的计算单元组成的系统的计算方式。

20世纪80年代,异构计算技术就已经诞生了。所谓的异构,就是CPU、DSP、GPU、ASIC、协处理器、FPGA等各种计算单元、使用不同的类型指令集、不同的体系架构的计算单元,组成一个混合的系统,执行计算的特殊方式,就叫做“异构计算”。

特别是在人工智能领域,异构计算大有可为。众所周知,AI意味着对计算力的超高要求,目前以GPU为代表的异构计算已成为加速AI创新的新一代计算架构。

我们为什么需要异构计算?

学习shader之前必须知道的东西——渲染管线

所谓GPU的渲染管线,听起来好像很高深的样子,其实我们可以把它理解为一个流程,就是我们告诉GPU一堆数据,最后得出来一副二维图像,而这些数据就包括了”视点、三维物体、光源、照明模型、纹理”等元素。
在各种图形学的书中,渲染管线主要分为三个阶段:应用程序阶段、几何阶段、光栅阶段。

1、应用程序阶段

这个阶段相对比较好理解,就比如我们在Unity里开发了一个游戏,其实很多底层的东西Unity都帮我们实现好了,例如碰撞检测、视锥剪裁等等,这个阶段主要是和CPU、内存打交道,在把该计算的都计算完以后,在这个阶段的末端,这些计算好的数据(顶点坐标、法向量、纹理坐标、纹理)就会通过数据总线传给图形硬件,作为我们进一步处理的源数据。

2、几何阶段

主要负责顶点坐标变换、光照、裁剪、投影以及屏幕映射,改阶段基于GPU进行运算,在该阶段的末端得到了经过变换和投影之后的顶点坐标、颜色、以及纹理坐标。简而言之,几何阶段的主要工作就是“变换三维顶点坐标”和“光照计算”。

可利用同一工具来对CPU和 PowerVR GPU上的移动与嵌入式程序同步进行调试

Imagination Technologies宣布推出具备完整功能的集成开发环境(IDE)PVRStudio,它可简化嵌入式与移动平台上的应用与游戏开发。利用 PVRStudio 2018 Release 1,开发人员便拥有了功能强大的PowerVR GPU调试工具,能在调试GPU上运行程序的同时,对在CPU硬件上运行的程序同步进行调试。

对于那些为带有 PowerVR GPU的产品创建应用与游戏的开发人员来说,通过直接对接运行在GPU统一着色内核(USC)上的执行程序,PVRStudio可提供粒度更精细的调试能力;因为大部分重要的3D绘图与运算应用程序都运行在USC上。这能使开发人员以最小的功耗实现令人惊艳的视觉体验。

Imagination Technologies公司 负责PowerVR软件绘图工程的副总裁Mark Butler表示:“ PVRStudio是面向移动与嵌入式GPU的全新调试工具,因为它给开发人员带来强大的能力去深入了解USC上着色器的运行实例。自此以后,开发人员能像他们过去数十年来调试CPU一样来对嵌入式/移动GPU进行调试,并能在相同的会话中,从CPU无缝地跨入GPU。”

【视频】全硬件虚拟化:PowerVR GPU可实现最大的利用率

此展示是由一个采用PowerVR Series6XTGPU的参考平台来实现的。在此例子中,两个单独的操作系统分别提交了两个应用程序,它们都在同一个虚拟化PowerVR GPU硬件上运行。

在视频一开始,两个操作系统的工作负载被赋予了相同的优先级,因此它们会被本地固件(fireware)在硬件上以轮询方式进行调度。可以看出,它们共享相同的GPU资源,因为它们达到了相同的性能(以每秒帧数fps来量化)。此外,从分析GPU内部的硬件计数器来看,硬件得到了最大程度的利用(没有明显的落差),显示出PowerVR虚拟化解决方案并没有增加会使利用率降低的额外负担 。


前往Imagination官方优酷观看: http://v.youku.com/v_show/id_XMzQ0MDY1MDkxNg==.html

技术文章:PowerVR虚拟化和Series8XT为汽车行业带来变革

具有领先性能、功率和面积比的GPU IP——The PowerVR Series8XT

PowerVR Series8XT 主要特性/优势

用于下一代应用程序的Furian架构内核

基于革命性的PowerVR Furian架构,Series8XT GPU系列提供两个和四个集群IP内核版本,提供了功耗和性能之间的理想平衡

双群集PowerVR GT8525使消费类设备能够在移动功耗允许范围内实现高分辨率,沉浸式图形内容和数据计算。

四集群的GT8540能够满足汽车制造商对2018年汽车内仪表板,导航和信息娱乐系统所需的超高分辨率和多重显示器等性能的需求。

具有领先性能、功率和面积比的GPU IP——The PowerVR Series8XT

同步内容
--电子创新网--
粤ICP备12070055号