一、前言:制程工艺不变 IPC性能暴涨20%的Zen 5架构

这十年来AMD的CPU给我们带来了一次又一次的惊喜!

今天上市AI PC所搭载的锐龙AI 300系列处理器,与上代的锐龙8000系列移动处理器一样,都是采用了台积电4nm先进工艺。

但如标题所言,基于Zen 5架构的锐龙AI 9 HX 370是当今最优秀的移动处理器,甚至没有之一!

那么AMD是怎么做到的呢,Zen 5架构和锐龙AI 300系列处理器到底做了哪些技术上的革新呢?

1、更多的算术逻辑单元(ALU)

重新定义高性能轻薄本!华硕灵耀16 Air评测:锐龙AI 9 HX 370当今最优秀移动处理器 第1张

在拥有了足够强大且成熟的设计能力之后,AMD的工程师大幅度提升了Zen 5核心的流水线宽度,ROB重排序缓冲区(Reorder Buffer)从原来的320个条目指令提高到了448个条目指令,增加了40%。

更宽的流水线,让Zen 5核心可以容纳更多的算术逻辑单元(ALU)和地址生成单元(AGU)。

Zen 4架构每个整数运算器中包含了4个ALU和3个AGU,而Zen 5则分别提升到了6个和4个。特别是至关重要的ALU单元数量相比上代增加了50%,这也意味着Zen 5核心在相同周期内能处理更多的指令。

配套的调度器数量也大幅度增长!

Zen 4拥有3x24一体化ALU/AGU Scheduler和单独的1x24 ALU Scheduler,总计是96个。Zen 5则设计了88 ALU Scheduler和56 AGU Scheduler,理论上可提升50%的运算吞吐量。

2、更快的L1/L2缓存

Zen 5主要改进了一级数据缓存(L1 Date Cache),从Zen 4的8路32KB提升到了12路48KB。

同时,通往一级缓存、浮点单元的最大带宽,也比上代翻了一番,并改进了相应的数据预取。

重新定义高性能轻薄本!华硕灵耀16 Air评测:锐龙AI 9 HX 370当今最优秀移动处理器 第2张

二级缓存的容量没有变化,依旧是每核心1MB,但是链路通道从8路倍增到了16路。简单的说,就是L2带宽翻倍。

更快的L1/L2缓存能让Zen 5核心拥有更稳定的峰值性能。

3、更高效的同构大小核设计

酷睿第12代处理器开始采用大小核策略让Intel一时风头无两,大核玩游戏,小核提升多线程性能。

核心数量和多线程性能上的劣势让AMD略显被动,而代号为“Strix Point”的Ryzen AI 300系列处理器就是AMD首次采用混合核心设计的产品。

重新定义高性能轻薄本!华硕灵耀16 Air评测:锐龙AI 9 HX 370当今最优秀移动处理器 第3张

Strix Point SOC包含2个CCX,大核拥有4个高性能Zen 5核心,16MB三级缓存;小核则有8个紧凑型Zen 5c核心,8MB三级缓存。

不同于Intel P-Core + E-Core的大小核异构架设计,Zen 5和Zen 5c拥有完全相同的架构设计、IPC性能和ISA指令集,不同之处只是后者缓存更小、频率更低(但能效更高)。

另外需要注意的是,由于Zen 5和Zen 5c分别位于2个CCX之中,它们的三级缓存虽然理论上可以互相访问,但延迟会有所增加,同时传输速率也会受到IF总线带宽的限制。所以AMD采取了特殊的控制策略,通过Windows调度管理,尽可能地让Zen 5、Zen 5c分别访问自己的三级缓存。

4、1024个流处理器的RDNA 3.5 GPU

在内置集显领域,AMD一直没有对手!

锐龙AI 300系列处理器集成了升级版的RDNA 3.5架构的AMD Radeon 800M系列GPU,最多拥有1024个流处理器,足足提升了1/3。

重新定义高性能轻薄本!华硕灵耀16 Air评测:锐龙AI 9 HX 370当今最优秀移动处理器 第4张

除了增加流处理器数量之外,RDNA 3.5还增强了向量指令集架构(ISA),提高了插值和比较的速率,从而提升了图形渲染的效率。

内存管理方面,AMD对图形数据结构进行了优化,包括L2缓存和SoC(System on Chip)总线,以减少内存访问次数,提高数据压缩技术和工作负载的优化。

按照官方说法,在同样的15W功耗释放下,Radeon 800M系列对比前代的3DMark理论性能,在Night Raid和Time Spy项目中分别提升了多达19%、32%。

当然,理论性能并非与实际等同,新一代的GPU架构肯定需要驱动的持续优化才能发挥出最佳效能。

重新定义高性能轻薄本!华硕灵耀16 Air评测:锐龙AI 9 HX 370当今最优秀移动处理器 第5张

除了以上几点之外,Zen 5处理器的浮点性能也得到了增强,拥有了完整位宽的AVX 512指令集。

其实Zen 4架构也能支持AVX 512 浮点运算,但它是通过2个256-bit FPU合并运算来实现,而Zen 5则是拥有完整的512-bit FPU以及与其位宽匹配的流水线管道。

对于支持AVX 512指令集的程序,例如AIDA64 GPGPU、Geekbench 6、PS3模拟器等应用,Zen 5架构最多可以带来50%的性能提升!

重新定义高性能轻薄本!华硕灵耀16 Air评测:锐龙AI 9 HX 370当今最优秀移动处理器 第6张

此次我们收到的是华硕送测的灵耀16 Air,它搭载的是锐龙AI 9 HX 370处理器,拥有4个Zen 5和8个Zen 5c内核,共计12核心24线程,二级缓存12MB、三级缓存16MB+8MB、Zen 5核心加速频率可达5.1GHz,本机性能释放28~33W。

这一款厚度仅有1.1cm的高端超轻薄笔记本,下面我们来看在30W的功耗限制下,锐龙AI 9 HX 370能发挥出怎样的性能。

收藏(0)