GPU

PowerVR 25周年---图形技术革新传奇

令人兴奋的是Imagination PowerVR技术已经迎来了它25周年纪念日——25年来一直引领着图形技术。为了庆祝这个纪念日,我们一起回顾PowerVR技术的发展历程,它是如何诞生并且发展到现在的阶段。

20世纪90年代图形技术进入到爆发式创新和增长阶段。在那个时期我们见证了第一款商业图形处理器支持3D渲染、视频和GUI加速,提供2D和3D图形开放应用程序接口(API)。很多新兴的公司涌入这个市场,经过不断的创新,图形技术不仅仅局限于个人电脑(PC)和游戏机设备,也开始应用到移动设备中。

在众多加入到半导体市场的新兴公司中,有一家公司名叫“VideoLogic(视频逻辑)”,成立于20世纪80年代,办公地点位于英国。起初这家公司专注于视频开发(公司因此得名),除了内部自己开发的技术还借助一些第三方解决方案。1992年夏天,也就是25年前,该公司启动了一个图形技术方面的新项目。这个项目最后演变为了PowerVR,提供了一种全新的3D渲染方法,我们相信这将给我们带来非常大的领先优势。

GPU渲染管线与shader

1、几何阶段(顶点shader处理这部分)

模型坐标空间-世界坐标空间-观察坐标空间-屏幕坐标空间
其中从观察空间 到 屏幕空间需要经过3步(CVV单位立方体,规范立方体)
a用透视变换矩阵把顶点从视锥体中变换到裁剪空间(齐次空间,用齐次坐标表示);
b在 裁剪空间进行图元裁剪;(这里就是视域剔除View Frustum Culling),然后齐次空间除w把点转换到CVV中
c屏幕映射:将经过前述过程得到的坐标映射到屏幕坐标系上

GPU渲染管线与shader

顶点着色程序从GPU 前端模块(寄存器)中提取图元信息(顶点位置、法
向量、纹理坐标等),并完成顶点坐标空间转换、法向量空间转换、光照计算等
操作,最后将计算好的数据传送到指定寄存器中;然后片断着色程序从中获取需
要的数据,通常为“纹理坐标、光照信息等”,并根据这些信息以及从应用程序传
递的纹理信息(如果有的话)进行每个片断的颜色计算,最后将处理后的数据送
光栅操作模块。

虽然已经被提及了很多次,但是这家与ARM一起同属于英国最好的、却低调得多的半导体公司,确是因为苹果在4月初宣布的负面消息推到了新闻风口,而他们以一场于4月26日在深圳举办的媒体见面会表示自己要开始全新的征程,即使离开苹果也能过得很好。

01、PowerVR:第一次在中国首发GPU内核,带来近似电影特效的画面感

苹果在4月初宣布的是将在两年内逐步放弃使用Imagination的GPU PowerVR,虽不是立即停用,但也给他们带来可称得上是灾难性的打击。在本次交流会上,Imagination的市场传播副总裁David Harold也表示,Imagination的年营收为1.2亿英镑,而来自苹果的收入占比接近50%。

在本次交流会上,Imagination发布了一款基于Furian架构的PowerVR内核GT8525。Furian是Imagination在3月初于美加州举办的年度技术峰会上公布的全新GPU架构,支持机器学习、图像识别、4K/120fps超高清视频流解析。不过Imagination在技术峰会上并没有公布基于这一全新架构的任何商用产品。

4月26日,Imagination媒体分享会于深圳蛇口希尔顿南海酒店举行,公司营副总裁David透露:去年中国区业务增长3倍,有很多新客户采用PowerVR GPU,未来公司将加大中国区投入,中国区人员将增长50%。



Imagination:SoC GPU的崛起和重新调整

2017年3月初, Imagination举办了年度技术峰会。在会议上,我们的高层主管人员和合作伙伴进行了为期一天的讨论。讨论的主题范围广泛,从增强现实(AR)和虚拟现实(VR),再到异构计算和物联网安全,均有涉及。当然,我们还讨论了PowerVR GPU IP的最新发展趋势,该IP在性能和功效方面将继续保持行业领先。

在会上,PowerVR商务部高级主管克里斯托夫·比茨发表了演讲,题为:“有升必有落:SoC GPU的崛起和重新调整。”本文便是基于这篇演讲。在本文中,我们将谈论技术和市场力量如何塑造SoC GPU的需求;以及根据特定细分市场的需求和优先事项,GPU需求如何变化。我们将提出一些有根据的推测,展示2025年SoC图像使用案例。

正如我们在Imagination所了解的,由于智能手机的驱动,嵌入式GPU在新世纪头十年的中期经历了巨大的发展,我们将原PowerVR MBX内核用于移动设备和 PowerVR SGX继承版。有了这些突破性的开端,以后每一代新硬件的性能都大幅提升。消费者也迅速适应具有高质量、流畅的帧速率及功效的游戏。

不过,创建游戏的软件开发人员总是寻求可以展示更高视觉质量的方法,同样,消费者的要求也越来越高。目前,任何使用显示屏的给定设备,无论是智能手机还是车载娱乐系统,都对高质量的图像效果有了很高的期待。

集成之路怎么走?“摩尔定律Plus”接班

据TechCrunch报道,我们现在正处于计算领域真正的转折点上,我们正在使用的技术每天都在进化。嵌入式传感器和网络接入的快速融入,正将我们使用的大部分电器变成“智能设备”,它们可对我们的语音指令做出回应,同时产生的大量数据又可在尖端网络计算机或云端进行分析。

我们看到虚拟现实(VR)和增强现实(AR)技术已经被开始采用,这些技术要求大量计算和图形处理能力才能为人类提供更真实的生活体验。加上机器学习的应用,它可通过大量数据训练及时提供符合情境的信息,或是接管大量普通任务。这些新的应用都在对计算机行业发起挑战,它需要在改进承受水平的情况下提供更多计算能力。

然而,提供更多计算能力存在巨大挑战,因为摩尔定律中半导体更新换代的步伐已经减缓。所谓摩尔定律,是指通过缩小电路体积、改进性能以及能源效率,集成电路上可容纳的元器件数量每2年就会增加一倍。过去,半导体技术非常依赖下一代计算机芯片,而这些芯片的价格更便宜,速度也更快。

Unity 5.6推出 改进图形性能以及支持Vulkan API

Unity科技公司日前推出了Unity5图形引擎的最终版,Unity 5.6。根据说明文档,这次更新主要是改进了图形性能、光照特性以及对Vulkan API的支持。

光照特性改善:加入了先进光照映射预览、提供立即反馈和快速迭代,还有新光照模式,允许通过多种方式来混合实时以及针对静动态物体的烘焙光源。

Unity 5.6推出 改进图形性能以及支持Vulkan API

Unity 5.6推出 改进图形性能以及支持Vulkan API

深度好文,详解PowerVR Furian GPU架构的改变(二)

昨日,《深度好文,详解PowerVR Furian GPU架构的改变(一)》一文展示了Furian中SPU的设计点其依赖USC的数量。相比Rogue,Furian的可扩展性使我们可以设计一个更广泛的目标性能点。接下来,本文将讨论USC、TPU 和PBE每块的性能。

USC

我们已经重新设计了Furian的USC。Rogue名义上是16位宽标量的SIMD机器,在2个周期内运行32位宽任务。Furian是 32位宽标量的SIMD机器,在单个周期内运行整个任务。我们还改变了Furian USC每时钟及每道所执行的内容。对于F32,Rogue可以每时钟每道并行执行一对FMA指令。Furian将并行FMA设置换成单个FMA,且并行相乘,故而与Rogue相同的USC,每时钟的运算量增加了50%。

自发布第一代Rogue,我们在GPU设计中一直保有相同的两倍速率的F16性能。近几年,F16的性能不断提升,图像相关的应用程序对于GPU供应商用户越来越重要。所以,目前,有相当多的GPU在售并不出奇,且通过微架构机制,F16性能更强。Furian也是如此,一直保有我们长期以来的性能。

深度学习的过去、现在和未来

一、过去:从猫到狗

翻阅1982年第1期的《世界科学》杂志,看到这样一则消息:“1981年10月17日,在瑞典的斯德哥摩尔城举行的诺贝尔奖授奖大会上,美国加州理工学院的罗杰•握尔考特•斯佩里(Roger Wolcott Sperry)博士和加拿大出生的美国人戴维•哈贝尔教授以及瑞典的托尔斯滕•韦塞尔分享了1981年诺贝尔生理学、医学奖。斯佩里因证明大脑两半球的高度专门化以及许多较高级的功能集中在右半球而获奖;哈贝尔和韦塞尔因研究视觉系统的信息处理方面有所发现而获奖。”

深度学习的过去、现在和未来

深度好文,详解PowerVR Furian GPU架构的改变(一)

图像领域发展日新月异。2012年,我们发布了第一款 PowerVR Rogue可授权GPU IP,在那之前,我们一直在研究微架构,并在2011年对其进行了展示。如今,发布PowerVR SGX的继承版已经6年时光,但它至今一直保持强劲势头。你会发现,目前Series7XT和Series8XE一直在使用其最新的版本。就性能和功能集而言,GPU可能是现代应用程序处理器中发展最快速的部分,但有个前提是,整个创建和装配过程的时间跨度非常大,尤其是要在微架构中详细地涵括某个概念时。

同步内容
--电子创新网--
粤ICP备12070055号