IDC:未来计算的十大特征

过去数十年,算力的发展经历了性能优化、综合创新两个阶段。在性能优化阶段,随着制作工艺的不断提升,半导体行业一直遵循着每隔18-24个月,集成电路上可容纳的元器件数目便会增加一倍的摩尔定律,芯片的性能也会随之翻倍。然而,近年来,芯片的制作正在接近物理极限,同时芯片研发的成本也越来越高,单靠芯片性能的提升已经五法满足数字化时代下新兴技术应用对算力的需求,例如人工智能领域中,新的算法模型无论是参数量还是复杂程度都开始呈现指数级的增长趋势。


为了应对新兴技术带来的挑战,算力进入了综合创新阶段。云计算落地使得算力以更经济方式得到普惠;除CPU之外的大量协处理器被采用,由GPU、FPGA等加速芯片构成的异构计算使特定领域下的计算性能得到极大的提升。

IDC认为,未来算力正朝着灵活部署、智能自治的方向演进。企业对多云、混合云的使用越来越深入,开始利用边缘计算形成云-边-端协同的部署方式,开始使用内存驱动的基础架构和新一代互联技术对算力进行优化,开始通过人工智能进行数据全生命周期的管理和运维,并着重建设数据安全体系和数字信任。针对算力的发展趋势,IDC总结了未来算力的十大特征。


从数据前端采集到处理、存储管理和应用,数据在企业内部和外部流转的全过程中都需要能够全方位支撑的IT基础架构,这种支撑对现在算力的平台的覆盖提出了更多的要求。


数据采集:全球各行业用户更加深刻地认识到数字化转型的重要性和必然性,边缘计算、人工智能、云、5G等技术在行业的应用越来越广泛且深入,技术的应用促使海量数据的产生。伴随着新业务的不断开发,企业数据呈全方位增加,且数据类型越来越多样,大量非结构化数据不断产生。这对数据采集系统的要求越来越高,系统需高效智能运用,并保证数据在后续的处理、决策、分析及信息服务能够全面、准确、及时。

数据的存储与管理:由于数据将成为企业重要资产,保证数据的可靠性是主要要求。业务和应用对数据基础设施的要求升级为可靠及可持续的服务,数据基础设施要支撑数据中心演进成为组织机构的数据运营服务中心,承担着运营支撑,信息资源服务,核心计算,数据存储和备份,以及确保业务连续性等任务,使得数据基础设施愈发复杂。

数据处理与传输:未来非结构化数据增速加快,对实时性需求也不断攀升,数据大量且多样化的增⻓给数据的处理带来了极大的挑战。当下各行各业的管理或生产在向智能化、自动化方向发展,比如金融的智能投顾、制造的智能质检等,这些业务场景都需要数据被快速传输并处理,以满足对数据的实时性需求,传统IT基础架构所提供的算力已经很难满足实际需求。

数据分析与利用:经过采集、存储、管理和处理的过程,系统需要从海量数据中迅速发现、快速捕捉有价值的信息进行准确分析和利用,使其价值最⼤化。在数字经济时代,数据正在借助多种新兴技术赋能应用,未来的算力将不仅存在于核心数据中心,也同时会覆盖到数据的采集、处理和应用过程中所涉及的端、边缘等设备的技术创新。从云、网络到边缘,未来计算平台将会在特定领域实现特定功能,提升数据分析和应用的能力。


随着企业业务的不断拓展以及数据量的爆发,单一的IT基础架构已经无法满足企业快速发展的需求,尤其通过对数据安全性、可扩展、可管理、性能、存储空间和成本效益等需求的综合考量,多云和混合云成为更多企业为了满足灵活性扩展做出的主流选择。

纵观全球,云计算已经从单纯地以满足资源型需求为主的中心云基础设施,发展成为汇聚各类信息技术,覆盖不同区域部署、兼顾垂直⾏业特定需求的新一代云平台生态系统,能够更好地⽀持企业的云原生应用、自动化管理和业务创新,并满足用户在任何时间、任何地点对任何应用的响应需求。随着企业业务的不断拓展,单一云的运营模式已经无法满足企业快速发展的需求,5G、人工智能、大数据,区块链等新技术的发展也将成为企业云计算平台建设的推动力,多云、混合云以及边缘云已经成为更多企业为了满⾜灵活性扩展做出的不二选择。因此,集云成本管理、云资源整合和跨云调度等功能的多云管理平台及服务应运而生,并将成为企业数字化转型的核心支柱。

随着多云时代的来临,越来越多的企业在确保IT基础架构稳定性和安全性的前提下,开始关注基础架构的敏捷性和运营效率。未来工作负载将越来越丰富,而多云和混合云构成的混合IT环境是未来数字化基础架构的发展趋势。企业也将针对不同的应用和工作负载进行基础架构选择并部署到最佳位置,将倾向于采用敏捷的数字基础架构并实现IT运营效率和创新能力的提升。

IDC预测,到2024年,全球应用程序的数量将超过过去40年的总和。而60%以上的ISV将重新架构或构建新的云原生应用,为客户实现云成本控制、云应用快速升级提供更好的选择。为了获得业务敏捷性,全球企业将致力于通过使用云原生开发和部署服务,在2022年前实现其50%的现有应用的现代化。


在企业业务需求推动下,人工智能应用已经实现从点到面式的发展,也从通用应用场景渗透到更多行业特定场景,逐渐成为企业发展和生存的刚需。随着AI技术在各行业的广泛应用,深度学习作为训练模型的主流算法,也需要强大的并行处理能力,服务器供应商通过为服务器配置更强大的处理器如:GPU,FPGA以及ASIC芯片等提升计算能力。


目前较为受关注的异构计算方式有CPU+GPU, CPU+FPGA以及CPU+ASIC,与传统服务器相比,异构服务器主要的提升为通过协处理器实现更多的并行计算和低延迟的计算能力,支持更大容量的内存满足当下实时负载增加的需求,提供更多外置硬盘插槽,并广泛支持NVMe/PCIE等协议,满足数据洪流需求。

在异构计算支撑下,人工智能能够解决的企业需求越来越多,对各行业的渗透更加深入,其中互联网、政府、金融、电信、制造等行业对于人工智能的使用已经日趋成熟,很多碎片化应用也开始被广泛使用,并辐射到媒体娱乐、现代农业、智能家居等多个不同领域。目前中国较为成熟的应用场景包括精准营销、公共安全及预警等。未来,有望得到⼴泛的应用场景包括:智能导诊,自动驾驶,IT自动化等。这些场景的逐渐落地与应用,将进一步促进异构计算市场的发展。


IDC认为,未来数字化基础架构将从过去传统的云到端部署,演进为云-边-端协同无处不在的新型计算架构,越来越多的企业正在向混合型业务模式转型,新冠疫情也迫使企业做出改变,成为真正的“分布式”的企业,向混合型业务模式的转变将增加企业对灵活的、地理分散的基础架构资源的需求,尤其是边缘基础架构的需求。边缘计算从概念提出发展至今,已经逐步落地阶段,在中国,制造、交通、能源等行业已经率先布局边缘计算,道路管理、设备监测等多个场景。

人工智能的落地进一步促进了边缘计算的发展,边缘计算可以让人工智能就近服务于数据源或者使用者,未来,边缘智能将成为边缘计算的重要形态,从⽽更好地实现⾃动驾驶、智能安防、智能质检、智能诊断、智能家居等多个领域的应用。

IDC预计,到2023年,80%混合型业务的企业将会把至支持人工智能和边缘基础架构上的投资增加4倍,以确保实时的业务敏捷性和洞察力。根据IDC统计,2020年上半年,中国边缘计算定制服务器的出货量中,单路服务器占比已经超过10%,高于整体服务器市场中单路服务器6.1%的占比。


内存驱动的基础架构使⽤新兴的持久性内存技术来降低数据访问的延迟,这些延迟远远超出了主内存的有限容量,同时提供了极佳的性能和企业级存储管理功能。内存驱动的基础架构利用了诸如NVMe、NVMe over Fabrics、SCM等技术,提供了满⾜下⼀代应用不断发展的性能、可靠性和功能需求所需的功能,这些应用在企业数字化转型的加速过程中正被广泛的部署。

使用SCM技术有诸多好处,目前虽然固态硬盘在逐步的替换传统硬盘,使存储系统性能大为提升,但是从内存到固态硬盘之间仍然存在延迟的瓶颈,而SCM这种性能介于内存和固态硬盘之间的技术,可以有效帮助消除这一瓶颈,它能够提供接近DRAM的性能和更大的存储容量,每GB的成本比传统的内存更低,同时,该技术的性能密度提高了其他方面效率,例如需要较少的后端存储容量,缩减存储基础架构的开支,所以在实现DRAM替换和持久性内存这些用例上可以提升计算平台的性价比。


异构计算成为未来支撑超大算力的重要解决方案,而下一代互联技术同样得到快速发展为算力的提升提供基础。边缘计算、人工智能、高性能计算等工作负载均对运算能力和速度提出了前所未有的要求,而随着摩尔定律失效以及功耗的限制,未来的基础架构将从“以处理器为中心的计算”向“以内存为中心的计算”转变,通过解构实现以内存为中心的共享内存资源池将降低节点间的数据传输功耗和延时,从而促进未来算力和SCM技术的突破。

互联的定义即为GPU、FPGA、ASIC或其它加速卡与CPU之间的数据连接。在CPU与加速卡之间,以及加速卡之间形成的芯片互联技术被更多的采用,虽然PCIe有着非常通用的标准化设计,但带宽有限将会产生瓶颈IT厂商等在芯心互联技术方面持续升级,以提供速度更快和扩展性更强的互联。以CXL和Gen-Z为代表的等下一代互联技术取得快速发展,采用和扩展“以内存为中心”的互连是行业需要关注的技术方向,同时总线的创新也带来了在单个机箱外部扩展亚微秒级延迟技术的机会,为架构创新创造了可能。

PCIe即PCI-Express,是一种高速串行计算机扩展总线标准,也是目前主流的下一代总线标准,最常见的互联类型是PCIe 3.0。PCI 特别兴趣小组(PCI-SIG)于2017年底发布了PCIe 4.0标准,将 PCIe 3.0 的带宽翻了一倍,并于2019年正式发布了PCIe 5.0规范,带宽是PCIe 3.0的四倍。在即将来PCIe 5.0高带宽时代,通用CPU和加速芯片间的协同、互联以及内存共享不仅将成为主流趋势,还将推进异构服务器的性能扩展以及算力的大幅提升。

CXL互联协议是基于PCIe 5.0之上的互联方案,服务于高性能计算机和数据中心领域的超高速互联新标准,主要用于CPU和加速芯片之间通信。在PCIe5.0高带宽时代,CXL将会成为一项关键性技术,使加速器和CPU之间实现更加连贯的内存共享。随着数据爆炸式增长,以及特定工作负载的快速创新,例如压缩、加密和人工智能等促进了异构计算中专用加速器和通用CPU的协同工作。这些加速器不仅需要与处理器实现高性能连接,理想情况下,它们还能够共享一个公共内存,以减少损耗和延迟。CXL在CPU和加速芯片(如GPU、FPGA 和网络)之间创建了高速、低延迟的互连性,使设备之间实现内存一致性,允许资源共享,同时可以简化相关硬件的设计难度和软件堆栈的复杂性,降低整套系统的成本。

Gen-Z是一种开放系统互连架构,旨在通过直接连接、交换或Fabric拓扑为数据和设备提供内存语义访问。Gen-Z以内存为中⼼的基于标准的方案致力于提供开放、可靠、灵活、安全和高性能的架构,在巨量信息进入数据心之际实现对它的容纳和分析。Gen-Z技术支持广泛的新型存储级内存介质和加速设备,采用了以内存为中心的新型混合计算技术和经过性能优化的系列高效解决方案。

另外,NVLink是一种高速、直接的 GPU 到 GPU 互联技术,通过为多 GPU 系统配置提供更高的带宽、更多的连接和改进的可扩展性解决互连问题。NVSwitch将多个 NVLink加以整合,在单个节点内以NVLink的较高速度实现多对多的 GPU 通信。Infinity Fabric总线技术,目前支持CPU-CPU以及GPU-GPU之间的连接,下一代Infinity Fabric技术将最多支持8个GPU芯片的连接,并支持CPU-GPU间的连接,为加速计算提供动力。还有OpenCAPI和CCIX等新兴互连标准,旨在为加速器,内存和处理器提供更紧密的耦合。


过去的几十年,承载算⼒的底层基础架构从大型主机到小型机、再到横向扩展的X86架构,经历了多轮演变。随着智能设备以及数据量的爆发对算力需求激增,面向企业关键应用、AI加速、大数据分析的⼯作负载层出不穷,以及超大规模数据中心应用越来越广泛等因素,均促使数据中心的机架密度迎来快速的上涨,这也成为企业降本增效的共识。IDC定义的密度优化服务器,是指具有多个计算节点且节点间共享电源、冷却、存储、网络、交互或管理等物理资源的服务器,实现在更小的空间内集成更多的处理器和I/O扩展能力,极大的降低了空间成本并显著提升系统性能。

超融合、异构计算等新技术促使密度优化服务器的形态更加多样,在整机柜机架密度以及服务器单机密度大幅提升的趋势下,将提升对数据中心的计算效率和功率密度,相应地对数据中心散热也提出了新的挑战。厂商在服务器的设计中不断进行创新和突破,在接近服务器或核心的CPU层面,采用风冷、液冷、风扇设计优化、机架后方热量交换器等新型的冷却技术来有效降低服务器单机散热的问题。


目前,CPU内核的数量扩展越来越多,主流芯片支持64个核心,未来核心数还会进一步扩展,这个使得CPU的性能增长更加线性,同时功能集的一致性得到增强,可以有效帮助计算平台支撑横向扩展以面向全新的IT基础架构,同时满足AI等数字化架构的全新应用需求。简单说,用户需要更多数量的内存来填充每个核,而不只是考虑更多的内存容量,如何选择合适的内存数量和容量,从而达到性能最优,是用户在采用Chiplet架构时需要重点考虑的问题。

Chiplet从初期的设计思路提出,到AMD的EYPC系列的成功,开始进如主流视野,随后应⽤于FPGA芯片中。未来,Chiplet设计会成为提升算例的另一个演进方向,该生态将会由传统芯片厂商、小型初创企业以及超大规模互联网公司共同建设,对于最终用户来说,无疑是降本增效的选择之一。


智能运维将依赖于人工智能技术和机器学习实现,云计算为资源调配提供了一个控制点和自助服务功能,使开发和DevOps团队能够快速访问资源。智能运维可持更高级别工作负载的可移植性和对高度动态应⽤程序的支持,同时可以控制成本,实现安全法规的遵从性。


确保数据的安全应从最底层的IT基础架构开始,IT基础架构的透明化对于数据的安全性和可靠性对于下一个十年至关重要,未来,将有更多的安全解决方案利人工智能、区块链等一些新兴技术,以提高风险管理能力,并实现预先的威胁监测等防护功能。除此之外,IDC认为,供应链网络的安全同样重要:供应链网络的安全需要确保在半导体、各子系统和系统制造的各个阶段保护产品的IP和安全完整性,它可以确保在半导体制造以及半导体和⼦系统被纳入最终产品时的安全。这使得知识产权所有者可以信任供应链合作伙伴,并帮助供应链合作伙伴获得更多的客户,因为其知识产权受到了保护,它还可以确保产品不受篡改并可溯源,在供应链的各个环节确保更高的安全性。

来源: IDC、智能计算芯世界

声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。

最新文章