今年3月底的一次研讨会上,Intel公布了2023-2025年至强平台路线图,首次公布了未来四款重磅新品的代号、工艺和初步设计。

Hot Chips 2023大会上,Intel详细介绍了其中的三款新至强,包括诸多技术细节,以及性能水平。

首先是Emerald Rapids,现有第四代可扩展至强(Sapphire Rapids)的继任者,命名为第五代可扩展至强。

它在工艺、架构、接口等各方面都保持不变,相当于一个升级增强版,比如频率更高之类的,但细节暂未公开,预计最多增加到64个核心。

Emerald Rapids目前已经向客户送样,将在第四季度按期发布上市。

Intel预告未来三大至强:144个纯小核 功耗只需200W 第1张
Emerald Rapids晶圆

Intel预告未来三大至强:144个纯小核 功耗只需200W 第2张
Emerald Rapids样品

明年才是重头戏,并且首次分两步走,一个是上半年的纯小核Sierra Forest,一个是稍后跟进的纯大核Granite Rapids。

之所以会分两条腿走路,Intel表示,原因主要是市场和客户需求的变化。

一方面,HPC高性能计算、AI人工智能都属于计算敏感型应用,依然需要强大的单核、多核性能。

另一方面,更高的核心密度、更高的能效的需求越来越高,传统的高性能核心难以满足,而且容易造成浪费。

事实上,AMD这一代霄龙处理器,就是走的这种路线,既有高性能的Zen4架构(最多96核心),也有高密度高能效的Zen4c架构(最多128核心)。

Intel预告未来三大至强:144个纯小核 功耗只需200W 第3张

Sierra Forest、Granite Rapids新至强都采用了模块化SoC设计,一是包含处理器核心、内存的计算模块,二是负责输入输出的IO模块,彼此分离,再结合EMiB封装、网格互连接口(mesh fabric interface),可以灵活组合、扩展。

基本单元是核心模块(Core Tile),包括核心、二级缓存、三级缓存、网格互连接口等部分。

值得一提的是,E核、P核之间共享IP、固件、操作系统、软件堆栈,开发利用更为简洁高效。

新至强支持最多12通道的DDR5内存,包括新的MCR DIMM规格,通过多路合并获得更高带宽,还有新的Intel Flat Memory技术,可在DDR5、CXL之间实现硬件管理数据转移,使得内存总容量对软件可见。

同时支持最多136条PCIe 5.0/CXL 2.0通道,最多6条UPI总线。

Intel预告未来三大至强:144个纯小核 功耗只需200W 第4张

Intel预告未来三大至强:144个纯小核 功耗只需200W 第5张

Intel预告未来三大至强:144个纯小核 功耗只需200W 第6张

Intel预告未来三大至强:144个纯小核 功耗只需200W 第7张

E核是全新设计的架构,前端、乱序引擎、标量引擎、矢量引擎、内存子系统等规格模块都针对能效进行特别优化,同时与P核共享硬件平台、软件堆栈,还会用上先进的Intel 3制造工艺。

每个E核具备64KB一级指令缓存,每2个或4个E核组成一个模块(Tile),共享最多4MB二级缓存,共享频率和电压域,共享网格互连接口,然后所有E核共享三级缓存,平均每4个分配到3MB。

软件功能支持BF16、FP16数据格式与转换,支持AVX AI加速等各种现代指令集,以及RAS可靠性、安全特性、虚拟化。

Sierra Forest最多144核心,支持单路、双路,也就是单系统最多288核心288线程,功耗则低至200W。

对比现有四代至强,它的核心密度增加最多2.5倍,能效则提升最多2.4倍。

Intel预告未来三大至强:144个纯小核 功耗只需200W 第8张

Intel预告未来三大至强:144个纯小核 功耗只需200W 第9张

Intel预告未来三大至强:144个纯小核 功耗只需200W 第10张

P核则是基于成熟架构,针对单核性能优化并提升能效,具备单独的电源管理控制器,重点改进分支预测、未命中恢复,同样是Intel 3制造工艺。

每个P核具备64KB 16路一级指令缓存,支持增强型AMX指令、新的FP16浮点指令,号称混合AI负载性能提升2-3倍。

Granite Rapids则支持单路、双路、四路、八路,但核心数量暂未公开。

Intel预告未来三大至强:144个纯小核 功耗只需200W 第11张

未来,P核、E核至强将分别继续演化,其中E核的下一代代号Clearwater Forest,有望用上Intel 18A工艺,预计最早2025年面世。

Intel预告未来三大至强:144个纯小核 功耗只需200W 第12张

收藏(0)