本文作者:五菇凉

逾10年潜心自研芯片创新,亚马逊云科技Graviton在新实例中已打下三分天下

五菇凉 11-22 5
逾10年潜心自研芯片创新,亚马逊云科技Graviton在新实例中已打下三分天下摘要: 【TechWeb】11月22日消息,近日,云成本管理和优化平台Vantage发布的一项调查显示,2024第一季度,在Amazon EC2 M7系列通用实例的成本支出方面,采用Ama...

【TechWeb】11月22日消息,近日,云成本管理和优化平台Vantage发布的一项调查显示,2024第一季度,在Amazon EC2 M7系列通用实例的成本支出方面,采用Amazon Graviton的M7g系列已经超过三分之一(34.5%)。

这里面,采用Amazon Graviton的M7g系列、采用英特尔的M7i系列、采用AMD的M7a系列都是亚马逊云科技提供给客户的实例,客户可以根据自身IT架构、业务需求、成本需要等多方面因素综合考虑选择适合自己的最优实例方案。

逾10年潜心自研芯片创新,亚马逊云科技Graviton在新实例中已打下三分天下

Amazon Graviton正是亚马逊云科技旗下的自研芯片系列之一。

在很多人眼中,亚马逊云科技可能只是一家提供云计算服务的公司,实际上,亚马逊云科技也是一家率先进入自研芯片领域、制造自有硬件的公司,拥有一系列定制芯片和加速器。

亚马逊云科技自研芯片团队致力于不断突破计算机硬件设计和制造的极限,帮助客户提升效率、安全性和可持续性,并降低成本。

经过10多年的发展,亚马逊云科技自研芯片Amazon Graviton承载的实例,已经跟英特尔和AMD这两芯片巨头打出“三分天下有其一”的局面! 这一数据背后,折射出亚马逊云科技自研芯片的不凡实力。

全面布局,超10年深耕芯片自研

作为全球最大的云服务商,亚马逊云科技的高级系统经理们认为,每一项云服务背后,软硬件之间的交互远比多数人想象的要密切。软件故障可以轻易修复,但硬件问题通常意味着团队需要从头再来,而且周期可能很长。可以说,“稳定、高效、安全且更低成本”的硬件是一切优势云服务的基础。

2013年,亚马逊云科技高级副总裁James Hamilton提出开发定制硬件业务策略,并被亚马逊云科技领导层所采纳。而这一决策的初衷是为客户提供更多创新可能。

此后,亚马逊云科技通过垂直整合、定制硬件设计以及与合作伙伴的紧密合作,推动其芯片产品的不断演进。

2013年,亚马逊云科技开发了Amazon Nitro芯片,将虚拟化管理程序和授权功能从服务器CPU中剥离出来,从而提升数据中心的效率和客户价值。这项创新就像为亚马通云科技基础设施流量设置了一道安全关卡,大大提高了其安全性和可靠性。

随后,在2015年,亚马逊云科技收购了半导体微电子公司Annapurna Labs,这是一个重要节点,Annapurna团队成为亚马逊云科技后续芯片开发的核心力量之一。这一收购加速了Nitro系统的开发,并进一步推动了亚马逊云科技在硬件领域的创新。

2017年,亚马逊云科技发布了由Annapurna Labs开发的首款自研芯片--Amazon Nitro,包括硬件及其支持的虚拟化平台Nitro System。

2018年,亚马逊云科技发布了首款基于Arm架构的Graviton芯片,在性能和成本均进行了优化,可为可扩展工作负载带来高达45%的成本节约。

……

历经持续创新,截至目前,亚马逊云科技已推出四大自研芯片产品组合,包括:Amazon Nitro系统(六代)、通用处理器芯片Amazon Graviton(四代)、机器学习训练芯片Amazon Trainium(两代)和推理芯片Amazon Inferentia(两代)。

Amazon Graviton代际算力性价比提升均在两位数起,追求极致增效降本

事实上,降本增效一直是云客户关注的重点。

Amazon Graviton源于亚马逊云科技对降本增效极限的不断探索,其设计更符合云计算业务和新时代需求。

最显著的区别是Graviton处理器使用基于Arm的架构,而Intel和AMD使用x86架构。这种区别会影响性能和兼容性的许多方面,最重要的是处理器如何处理线程以及与某些软件库或第三方应用程序的潜在Arm兼容性问题。

Amazon Graviton支持广泛的应用场景,包括高性能计算、机器学习、人工智能、容器化应用构建、数据分析、数据处理等等。

最重要的是,自2018年推出首款以来,过去5年, 亚马逊云科技发布了四代Amazon Graviton实例,真正做到了,每一代的Amazon Graviton都会比上一代有两位数的性能提升,同时单位算力的功耗持续下降:

2020年推出的Graviton2与第一代Graviton相比,处理器性能提升7倍、计算核心数量多达4倍、缓存达到2倍、内存速度达到5倍;

2021年推出的Graviton3,单核性能比Graviton2又提升25%,浮点性能提升2倍,与同类型其他EC2实例相比,可节省60%的能源消耗,同时还首次在云计算芯片中采用性能更强、功耗更低的DDR5内存;

2022年推出的Graviton3E,专门对浮点和向量指令运算进行了优化,基于其推出的Hpc7g 实例与Graviton3实例相比,矢量指令性能提高了35%;

2023年推出了Graviton4,性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上。

特别值得注意的是,Amazon Graviton4是首次面向实际应用设计CPU架构,即从传统的MicroBenchmark基准测试评价体系,转向以实际工作负载进行评价标准。亚马逊云科技设计了真实工作负载雷达图,将CPU微架构涉及的参数特性分为前端和后端,并各自列出六项参数特性,相应轴上的数值代表其与该参数的依赖程度,数值越小依赖程度越低,即工作负载处理效率越高。因此在CPU设计时,即可以通过雷达图的面积来更好地衡量实际工作负载的优化效果。

目前,最新一代Amazon Graviton4的EC2实例已全面上线,包括M8g通用型、C8g高性能计算型、X8g和R8g内存优化型实例。

同时为了大幅降低客户将应用迁移到 Graviton的复杂度,让客户更轻松获得Graviton实例带来的高性价比,亚马逊云科技还推出了越来越多基于Graviton的托管服务,客户仅需几分钟将托管服务转移到Graviton实例上即可实现高达40%的性价比提升。

选用基于Amazon Graviton的Amazon EC2实例以及托管服务正成为越来越多亚马逊云科技的客户的选择。

亚马逊云科技基于Amazon Graviton的Amazon EC2实例种类达150多个,在全球已经部署的的Amazon Graviton处理器数量超过200万个,并拥有超过50,000客户,其中也涵盖了Amazon EC2前100客户90%以上。

Vantage数据显示,2024年第二季度,在Amazon RDS、Amazon ElastiCache和Amazon OpenSearch托管服务中,客户选择使用基于Graviton已超越了英特尔,越来越多客户选择基于Graviton的托管服务。

Vantage认为:切换到Graviton处理器对企业来说是一个重要的机会,可以在保持甚至提高性能的同时优化成本。虽然转向Graviton确实需要仔细的规划和测试,但成本节约和性能改进方面的潜在回报使其成为一种值得考虑的策略。

在2022年的亚马逊云科技芯片创新日(Silicon Innovation Day)活动上,亚马逊高级副总裁兼杰出工程师James Hamilton在展望未来时曾表示,亚马逊云科技将继续加大在硬件研发方面的投入,推动下一代处理器的创新,以满足全球客户日益增长的需求。他坚信,随着技术的不断发展,亚马逊云科技将继续保持在云计算和硬件设计的前沿,引领行业走向更加高效、智能的未来。(果青)

阅读
分享