一年一度的COMPUTEX已经落下了帷幕,今年的主题为“AI串联、共创未来”,相比于前些年的“惨淡”,由于AI技术的大热,让这届展会看点十足,尤其是这两年非常火的AI PC领域上,英特尔、AMD以及高通相继“亮剑”,分享了它们最新的产品、布局和进展,今天笔者就带大家来回顾下本届展会它们在AI PC这块的新动态。
再度颠覆的Intel
去年11月,英特尔发布了面向AI PC所打造的酷睿Ultra处理器(Meteor Lake),不仅有全新的Intel 4制程工艺和3D封装混合架构,有着新的性能核和能效核以及Arc GPU,并且集成了专为AI设计的NPU,与CPU、GPU结合更灵活的应对不同场景下AI算力需求,带来了被英特尔称为40年来最大的处理器架构变革。
而在今年的COMPUTEX 2024上,英特尔公布了面向下一代AI PC的Lunar Lake架构的细节,包括模块化结构、封装工艺、全新性能核与能效核、线程调度、GPU、NPU以及连接等等,可以说再次对之前进行了颠覆。
我们一个个聊,首先是模块化结构和封装,Lunar Lake依旧延续了Meteor Lake的分离式模块设计,但简化为了计算模块(Compute tile)、平台控制器模块(Platform Controller tile)两部分,采用3D Foveros封装工艺。
更重要的是,英特尔首次将将内存集成到封装内,称其为“封装级内存”,2颗内存容量最高32GB,最高支持LPDDR5X 8533。
封装到SoC内部缩短了内存走线,能够将物理功耗降低40%,当然这也就意味着Lunar Lake的终端设备应该是不会配备内存插槽了,无法进行后续的扩展。
考虑到目前大型应用以及生成式AI对内存的占用,目测下一代终端大都直接是上32GB内存。
接着是全新性能核与能效核,Lunar Lake采用了全新的Lion Cove性能核,对比Meteor Lake性能核IPC平均提升约14%;而更为惊人的还是Skymont能效核,相比Meteor Lake中的LP能效核浮点IPC性能更是平均提升了68%。
英特尔表示4个能效核组成一个集群,对比Meteor Lake中的2颗LP能效核,在相同性能下,功耗仅为它们的1/3,而相同功耗下性能是它们的2.9倍,峰值性能则是它们的4倍。
这次Lunar Lake最多为4个性能核和4个能效核,没有单独的LP能效核,而是将这部分融入了CPU计算集群当中,且性能核取消了超线程,没错超线程没有了,也就是说这代Lunar Lake最多就是8核心8线程,确实让人感到有些意外,从这可以看出英特尔这代没有选择去堆核心数量,而是主打一个高效。
而且这次英特尔还为新的架设计了全新的硬件线程调度器,使用了动态的调度策略,有合适的负载会优先给单能效核,负载更大需要更多性能时优先调用其它能效核,性能需求进一步增加时,才会转向性能核,以此来获得更好的能效表现。
然后是GPU和NPU,前者升级到了第二代Xe2微架构,拥有8个第二代Xe核心,性能约为前代的1.5倍,它能够提供高达67TOPS的算力;后者被它们成为NPU 4,也就是第四代,它拥有6个神经计算引擎,是前代的3倍,还有12个增强的SHAVE DSP,能效优化的MAC阵列、2倍带宽,并支持原生激活功能和数据转换等,算力高达48TOPS。
同功耗下,NPU4相对NPU3有两倍性能,峰值性能则达到了NPU 3的四倍。
关于Lunar Lake平台的整体算力,CPU为5TOPS,GPU为67TOPS,NPU则为48TOPS,总算力达到了120TOPS,三大引擎各司其职,面对不同负载的需求,高效灵活的进行应对。
从目前公布出来的信息来看,Lunar Lake对比前代可以说再次实现了颠覆性的变化,不得不说在AI PC这块,英特尔确实是投入了非常大的精力。
我觉得最值得注意的一个是能效这块,从目前官方给出的数据来看是提升是非常的大,但数据毕竟是数据,实际的提升还得落到产品层面;还有就是AI算力的大幅提升,对比前代直接实现了数倍的增长,更强的算力对于相关AI应用的体验应该会带来明显的提升,当然这同样需要在实际产品落地后进行验证。
搭载Lunar Lake处理器的终端设备应该会在下半年的晚些时候登场,颠覆性的变化能否带来颠覆性的体验,值得期待。
大步向前的AMD
正如之前所曝光的那样,AMD将面向下一代AI PC的全新移动处理器改名为了锐龙AI 300系列,其CPU采用了最新的Zen 5架构,GPU为升级版RDNA3.5架构,NPU为全新的XDNA2架构,CPU、GPU、NPU三大计算单元全面提升,不过依旧是延续了4nm工艺制程。
AMD这次不仅又改变了产品的命名方式,还将AI直接加入了型号名称中,可见它们对AI的重视。而之所以直接从300系列开始,因为这是第三代AI PC处理器了,
首批只有锐龙AI 9 HX 370和锐龙AI 9 365两个型号,定位都是高端市场,而且需要说的是,这里的HX的意思并不同于面向高端游戏本的锐龙9 7945HX等,应该是代表更为高端的意思。
其中锐龙AI 9 HX 370拥有12核24线程,最高加速频率为5.1GHz,24MB三级缓存,GPU为Radeon 890M,拥有16个CU单元,全新XDNA2架构的NPU算力来到了50TOPS;另外一款锐龙AI 9 365为10核20线程,最高加速频率频率达5.0GHz,24MB三级缓存,GPU为Radeon 880M,12个CU单元,NPU部分与上面保持一致。
可以看到,锐龙AI 300系列不仅有架构上的升级,CPU部分打破对了多年的8核16线程,没错,AMD这边开始堆核心数量了,而且都是大核,只能说有点意思,GPU也提供了更多的CU单元,NPU则对比前代实现了3倍多的算力提升。
根据AMD官方给出的数据,XDNA2架构NPU不仅计算性能提升5倍(锐龙AI 9 HX 370对比锐龙9 8940HS在Llama 2 70亿参数大模型从启动到获得第一个token的响应速度测试),能效、多任务并行能力也都有翻倍提升。端侧AI算力的提升可以有效提升本地AI体验,充分发挥AI在低时延、安全、个性化等方面的优势,为相关AI应用的高效流畅运行提供充分的算力基础。
而与高通、苹果、英特尔的竞品相比,锐龙AI 9 HX 370在生产力方面都实现了明显的领先。游戏方面,对比酷睿Ultra 9 185H平均领先达到了36%。不过它对比的英特尔那边都是上一代产品了,意义没有很大。
当然,除了硬件这块的升级外,AMD再次强调了在生态应用上的布局,2024年内的ISV合作厂商将超过150家,包括Adobe、微软、Topaz Labs等巨头,也有百川智能、钉钉、无问芯穹、有道等国内企业,毕竟再强的AI算力如果没有落实到应用当中为用户所用也没有任何意义。
相比于前代的“挤牙膏”,这次的锐龙AI 300系列可谓是大步向前,CPU、GPU都拿出了更多的核心,NPU算力更是成为了当下最强,虽然没有像英特尔那样再次颠覆自己,但看点同样是蛮多的,而且这代甚至将“AI”都加入了型号当中,可见AMD对AI PC的重视程度。
当然,算力这块两家其实没有拉开明显的差距,相比之下竞争点更多的还是AI应用的实际体验以及软件生态的建设这块。
野心勃勃的高通
与英特尔和AMD将重点放在未来的新品上不同,高通在本届COMPUTEX 2024上的并没有发布新品,而是重点阐述了搭载骁龙X系列的PC正如何赋能PC行业变革,“重塑PC”的主题无疑展现出了高通在PC和人工智能领域的勃勃野心,提供硬件算力、布局软件生态以及赋能开发者,这些它们都要做。
在2023年年底的骁龙峰会上,高通发布了旗舰级的骁龙X Elite处理器,在今年四月份则带来了次旗舰骁龙X Plus,出色的性能释放、优秀的每瓦性能以及同等性能下更低的能耗都是骁龙平台的优势所在,对于轻薄笔记本设备而言,这些特性上的领先十分具有现实意义。
同时,NPU作为关键的差异化因素,使搭载骁龙X系列的PC具有卓越性能,将AI工作负载从CPU和GPU转移到NPU,可在显著提升性能的同时降低功耗。
与苹果的M3相比,骁龙X Elite NPU的每W性能能达到它的2.6倍,是酷睿Ultra 7的5.4倍。用高通公司总裁兼CEO安蒙的话来说就是:高通技术公司正在重构Windows PC生态系统的性能领导力。
高通NPU的优势能够体现在很多不同的应用领域,凭借高达45TOPS的AI算力,几乎PC的所有应用领域都能利用NPU打造更佳的用户体验。在软件开发编程领域,软件开发人员能够利用终端侧45TOPS的NPU算力即时生成代码;这些算力能帮助用户实现图像画质增强、AI滤镜、AI降噪等丰富应用。
骁龙X Elite还支持70亿参数规模的大语言模型以每秒30 tokens的速度在终端侧运行,目前已经有不少案例已经在实际应用。高通还展示了AI在音乐制作、视频编辑和游戏体验中的应用,以及与Deloitte等合作伙伴的商业AI模型合作,凸显了AI PC在提高生产力和创新方面的潜力。
除了努力为用户提供更好的体验外,面向广大开发者,高通推出了一个跨平台、跨终端、跨操作系统的统一软件栈—高通AI软件栈(Qualcomm AI Stack),支持所有目前主流的训练框架和执行环境,为开发者提供不同级别、不同层次的优化接口以及完整的编译工具链,让开发者可以在骁龙平台上更加高效地完成模型的开发、优化和部署。
此前高通还推出过高通AI Hub模型库,为开发者提供超过100个预优化的AI模型,包括语言、文本和图像在内的生成式AI模型以及例如图像识别、图像分割,自然语言理解、自然语言处理这样的传统AI模型,加速AI应用的开发。
高通不仅通过骁龙X系列芯片为设备提供底层算力,还携手生态合作伙伴打造应用,为开发者提供便利的开发工具,同时与微软也有着紧密的合作,作为连接硬件算力和AI应用的中间层,操作系统同样扮演着关键角色,可以说高通在软硬件层面都进行了全方位的布局。
虽然相比于英特尔和AMD两家的AI PC,高通这边的产品确实有点“珊珊来迟”,但从另外一个角度来说,它们的准备时间更长,准备的应该会更为充分,目前诸多OEM厂商的新品都已经上架开售,究竟有着怎样的实际表现,能否真的带来“重塑PC”的体验,大家可以拭目以待。
写在最后
从本次COMPUTEX 2024来看,AI PC显然已经成为了一片“兵家必争之地”,作为底层算力提供者的三大“玩家”英特尔、AMD以及高通都各显神通。
其中英特尔和AMD都公布了其下一代处理器,相比之下AMD的锐龙AI 300系列在CPU、GPU、NPU三大计算单元都获得了全面提升,所以我用了大步向前来形容,但整体的产品逻辑并没有非常大的变化。
而英特尔的Lunar Lake的变化则用颠覆来形容更为合适,不仅着重于提升AI算力和能效,还推翻了很多之前产品的特性和功能,说实话是有些出乎大家的意料了,毕竟前代刚刚大改,这代却没有选择稳步提升,而是再度颠覆,只能说英特尔在AI PC上下的功夫确实足够多。
至于高通,这次虽然没有新处理器登场,但无疑展现出了其勃勃的野心,想要通过AI PC让自己成为行业的颠覆者,而与此同时搭载骁龙处理器的AI PC已经上架,究竟如何还是要经过消费者和市场的验证。
但不管怎么说,下半年AI PC市场的竞争肯定会愈加激烈,这种竞争不仅仅是在英特尔、AMD以及高通等底层算力提供厂商之间,OEM厂商的竞争同样会非常激烈,使用相同算力的芯片,如何通过差异化的体验去赢得消费者的青睐,更为出色的易用性、更丰富的生态应用、更智能的交互体验等等,都需要投入很大的精力。