11月13日消息,AMD宣布推出第二代Versal Premium系列自适应SoC芯片,为各种工作负载提供最高水平的系统加速,也是FPGA行业内首款在硬IP中支持CXL 3.1协议、PCIe 6.0总线、LPDDR5内存的器件。
新产品主要有三大方面的创新:一是加速主机连接,二是释放更多内存,三是加强数据安全。
得益于新一代的传输接口、存储器,第二代AMD Versal Premium系列可以在处理器、加速器之间快速、高效地访问和迁移数据。
尤其是CXL 3.1、LPDDR5,可以更快地释放更多内存,满足数据中心、通信、测试测量领域内日益增长的实时处理和存储需求。
该产品非常适合数据密集型的高带宽应用,比如通信领域的6G RAN加速AI、城域/核心交通、数据中心互联、安全设备,数据中心领域的计算加速、定制AI网络、计算存储、企业级SSD,测试与测量领域的PCIe 7.0分析器、摄像头/传感器测试仪、无线测试仪、存储/CXL测试仪,等等。
通过更好地管理系统内存,第二代AMD Versal Premium系列可以提供强大的计算助力,这正是现在AI模型和各种数据集成最需要的。
众所周知,这是一个数据爆炸的时代,尤其是在AI的推送下,海量的数据进一步刺激了对更多带宽、更高效传输的需求,同时数据安全问题也更加凸显。
内存存储是数据传输连接的关键一环。从分析数据来看,DDR5内存的出货量今年将第一次超越DDR4,成为真正的市场主流,下一代DDR6也有望在2027年出现。
CXL更是数据中心的发展重点,CXL连接内存的规模从2024年到2029年的年复合增长率预计高达212%,远超常规的系统内存和显存。
今年,大约一半的服务器都会支持CXL,预计到2028-2029年支持率可达99%。
第二代AMD Versal Premium系列正是为此而来,通过更快的主机连接、更快更多的内存、更连贯的接口,满足杨业发展需求。
既然有第二代AMD Versal Premium系列,那自然有第一代,已经生产一年。
第二代产品完整继承、复用了第一代的几乎所有设计,并针对I/O、收发器、内存存储、主机接口都做了升级创新。
这种基于量产验证、扩展升级的开发模式,可以降低整合新架构模块的风险,能够保证新产品的快速开发部署。
同时,制造工艺从第一代的7纳米升级到了6纳米。
不过要注意的是,第二代AMD Versal Premium系列不会直接取代第一代,而是并存,满足不同需求的用户。
这里列出了第二代AMD Versal Premium系列的主要创新,主机接口、内存、安全性方面是重点,后边会详细介绍。
注意看DSP计算密度方面,实现了更高的每平方毫米DSP算力(也就是性能密度)。
它还引入了一个新的收发器,支持非常广泛的协议,覆盖线速最低1.25Gbps,最高可以达到128Gbps。
另外在I/O方面,增加了对于高速MIPI C-PHY 10Gbps、D-PHY 4.5Gbps接口的支持。
内部架构分布图,可以看到配备了两个ARM Cortex-A72应用处理器核心、两个ARM Cortex-R5F实时处理器核心。
网络IP部分非常丰富,集成了100G多速率以太网核心、600G以太网核心、400G高速加密引擎。
PCIe 6.0标准早在2022年初就正式发布了,但落地商用还需要一段时间,第二代AMD Versal Premium已经率先引入支持。
它集成了两个可配置协议模块(CPM6),支持双路PCIe 6.0 x8连接,并具备CXL,每一路的单向带宽都高达64GB/s,双向则是128GB/s。
PCIe 6.0可以作为加速器与主机之间的高性能连接通道,满足枚举时间要求。
GTM2收发器也是一个重要新特性,可以结合第一代产品上面的两个收发器GTM、GTM1,灵活满足不同需求。
GTM2支持的数据速率非常广泛,可以从1.25Gbps到128Gbps,同时支持NRZ、PAM4编码,效率最高可达7pJ/bit。
同时,AMD保留了开发者非常熟悉的设计流程,可以轻松使用GTM2,并确保全过程的可靠性。
AMD这次升级支持了新一代高速内存DDR5-6400、LPDDR5X-8533,对比上代支持的DDR4-3200、LPDDR4X-4266,速率和带宽都翻了一番之多,同时功耗下降了多达20-30%。
安全性方面也大大增强,DDR5、LPDDR5X均內建ECC,还有AES-XTS安全加密,可以大大强化数据传输过程中的安全性。
CXL 3.1存储器扩展模块也是非常关键的一点,专门针对CXL 3.1规范设计的存储接口,可以和各家供应商的DRAM实现兼容。
举例来说,使用LPDDR5X内存可以实现最高256-bit 8.5Gbps的带宽,而使用两个8x CXL连接带宽可以达到64 Gb/s。
通过这样的架构,外部存储器的带宽可以超过500Gbps。
网络方面,第二代AMD Versal Premium具备全球唯一基于灵活应变平台的400G高速加密引擎,线速吞吐量最高达800Gbps。
它还具备AES-GCM-128/256加解密安全引擎,安全方面则全面支持MACsec、IPsec。
说到安全性,在不断变化的安全形势下,数据安全性变得日益重要。
第二代AMD Versal Premium提供了全套的PCIe IDE(主机接口)、高速加密引擎、DDR内联加密与ECC技术,使得数据无论是静态、传输中还是使用中,都非常的安全。
尤为值得一提的是,AMD Versal Premium自适应SoC与AMD EPYC CPU之间能够形成非常好的协同。
比如PCIe可以在二者之间提供高性能的连接,可用于卸载计算、网络以及存储工作负载。
比如非常连贯的接口可以让二者共享内存空间,从而减少搁置内存。
再加上PCIe IDE、内存加密等,数据可以做到真正的端到端安全性。
接下来是一些应用实例展示。
CXL 3.1可以扩大释放更多内存,也可以提供高性能的内存接口。
尤其是CXL 3.1使用了新一代PCIe Gen 6,对比CXL 2.0可以实现两倍的带宽,还可以利用NUMA轻松与现有的软件集成。
操作模式方面支持CXL.io、CXL.mem、CXL.cache,器件模式方面既可以作为内存的控制器,也可以使用主机模式,从而连接CXL扩展模块。
在用例方面,支持多主机单逻辑设备(MH-SLD)架构和系统可组合性。
很多客户都会购买并部署GPU计算集群,但是标准的网络接口未必能够支持GPU的性能和灵活性。
第二代AMD Versal Premium能够提供很高的带宽和灵活性,满足这方面的应用需求。
事实上,多年前的AMD Virtex UltraScale+、去年的第一代Versal Premium也都支持,但分别只有两个100G和两个200G挽留过,而现在第二代AMD Versal Premium系列能够在单个网络适配器上支持两个400G接口。
在测试与测量领域,大家对于开发PCIe 7.0这样的器件非常感兴趣,包括相关的分析器、控制器和练习器,但它需要128 Gbps的收发器。
这些应用非常重视芯片上的DSP引擎、内存带宽和其他接口能力,这也是第二代AMD Versal Premium系列支持的。
AMD为所有的Versal器件提供了统一的设计环境Vivado,而且每次发布都在改善,都支持全系列产品。
第二代AMD Versal Premium系列产品分为四款不同型号,规格各有不同。
比如逻辑单元从140多万个到320多万个不等,DPS引擎从3300多个到7600多个不等,GTM2收发器从32个到72个不等,片上内存、100G/600G以太网MAC、400G高速加密引擎、LDPC解码器等也各有不同。
共同之处则是都有双核A72(48+32KB L1/1MB L2)、双核R5F(32+32KB L1),以及256KB片上存储等。
第二代AMD Versal Premium系列已经向开发者提供早期文档,第四季度内会提供功率估算工具,明年下半年提供AMD Vivado工具支持。
2026年上半年提供芯片样片、开发套件,2026年年中正式投入量产。
AMD继续提供长达15年的生命周期支持。