前不久,Intel例行的发布了新一代CPU产品,但这次多搞了一点新意思。给传统的酷睿商标,加了一个"超级"的后缀,就是说把品牌进行了一个升级,现在叫做"超级酷睿"(Core Ultra)。当然,品牌名称都升级了,说明Intel也觉得这次升级的步骤还是比较大的,基本上是新换了一管牙膏接着挤的意思。
作为一个软件开发者,应该大概率也是一个计算机技术的爱好者。本文,笔者试图从一个相对更专业的电脑爱好者角度,来赏析一下Intel的这一个新一代CPU产品,看看现在业界主流的CPU技术的发展程度和方向。
当然,Intel CPU产品矩阵是比较庞大的,我们也不需要一一列举。所以笔者想从一个有代表性的产品入手,来进行鉴赏和分析。这里选择的产品学名是 "Intel Core Ultra 7 155H"。官方的规格信息页面在:
我们也可以使用CPU-Z软件,更直观的看到这个产品的主要技术规格。
基于以上规格信息,我们下面逐一展开分析。
产品定位和基本规格
此产品的类型名称为Core Ultra 7。应该类似于以前i7系列产品,就是在同一代产品中,定位于中高端的类型。经过前10余年的市场规划和教育,Intel已经告诉我们,它的桌面和移动CPU产品线主要分为三个系列:i3、i5和i7。分别定位在入门级(Entry)、主流(MainStream)和高端市场(Premium),所以在更早的时候i7就是Intel的旗舰CPU,但后来可能觉得还不够"极致",又开发了更高端的i9系列,定位在"顶级"(HighEnd)。所以现在的i7,包括Ultra 7,应该就是"次旗舰"的概念。
产品的型号为155H。这里的15应该是15代酷睿的意思。另一个5是在产品系列中的子序号。这个地方也简化了,原来的编码方式比如i7 9750H,9是代际,750是三位的子序号。注意这里的7不是i7的意思,因为有关产品叫i5 9300H。另外,Intel习惯给每个代际的CPU架构都起一个以"湖Lake"为主题的形象的产品代码,15代的架构名称为Meteor Lake(流星湖)。
产品编码中的H大致可以标识它的TDP级别,也就是性能释放级别。Intel常用的标识包括U(低功耗)、H(平衡)、P(性能)、K(高性能)等等。在规格说明中,这款155H CPU的热设计功耗(TDP)就是28W。TDP可以用于指导装机用户合理的选择散热和电源系统。现在随着制程和制造工艺的改进,新型的CPU都做到了比原来好很多的能源效率,发热量也得到了非常好的控制。
在提供一定性能水平的前提下,28W这个数字是一个非常优秀的功耗控制。这应该和它使用的新的制程有很大的关系。155H使用的就应该是Intel新的7纳米制程,终于摆脱了Intel使用了很多年的14纳米,这应该使Intel和AMD的竞争中,又一次占据了一个比较好的位置。
155H的CPU插槽使用Socket 2049 FCBGA,封装大小为 50mm x 25mm。这应该又是一个新的插座规格。相比而言AMD在这方面克制很多,对用户比较友好。另外155H不支持多处理器的安装方式。
在同一代中,155H还有一些兄弟产品,如定位稍高的165H、185H,定位稍低点的135H、125H等等。也有同一架构不同市场定位的U系列产品,详见下表。我们可以看到并且确认其次旗舰、主推产品的定位。
在表格中我们也可以看到Intel划分产品和细分产品市场的思路和实现方式。一个CPU产品的定位,主要是通过主频、核心数量和组合方式、缓存大小、内置的GPU和外围系统(如RAM和PCI-E版本和通道数量)的支持等方面进行划分的。
Intel对155H的最终的垂直市场定位是"Mobile"(移动),基本上就是提供给高性能笔记本电脑提供的CPU产品。所以在这里会更看重CPU的低功耗性能表现和能源管理效率。以做到高负载工作时能够充分的释放处理性能,而日常使用或者待机时尽量节省能源提高电池续航时间。
就性能和定位而言,根据笔者的简单查询和研究,和其比较接近的竞争产品应该是AMD Ryzen 5 7640HS。
最后,155H的上市时间是23Q4,就是2023年的第四季度。发布时的建议零售价格为503美元,符合其次桌面级次旗舰产品的定位。
详细的规格和说明
下面,让我们从一些重点的方面,来详细的了解和分析一下这款CPU的规格和特性。
核心和缓存
这一部分当然是一个重点。在各种类型的核心的配置上,155H的配置是:
- 6个性能核(P, Performance),不带超线程,所以这里有6个逻辑CPU
- 8个效能核(E,Efficient),带超线程,所以这里有16个逻辑CPU
- 2个低能耗核(LP,Low Power),没有算到逻辑CPU中
这里也可以看出现代先进CPU产品的一个设计思路,都是多个不同性能功耗类型的核心搭配和组合,再通过先进的软件执行调度,试图在软件执行效率和能耗上取得一个平衡,从而能够针对不同的计算任务,在尽可能比较低的功耗条件下,保证比较高的运行效率和性能。
和核心设计另一个重要的相关设计的就是缓存了。现代先进CPU设计一般都是三层缓存架构。155H的三级缓存,应该是Intel所谓的SmartCache,所有计算核心共享的24M;而二级缓存是为核心服务的,所有的性能核和低能耗核都是2M,8个效能核共享2M;一级缓存最接近CPU计算核心,对于所有核,都各有64K的指令缓存和32K的数据缓存。
频率和功耗
现代先进CPU的运行频率,都是可以根据需求和负载动态调整的,就是所谓的"睿频"技术,所以一般情况下,CPU的频率规格只有一个基础频率和最大睿频。在传统的CPU产品中,在同一个架构设计下,频率能够简单的代表CPU的性能,从而用于产品和市场定位。
对于多个不同类型的核心,其频率设计更为复杂。155H的性能核的基础频率和最高频率分别是1.44.8GHz,效能核0.93.8G,超低耗核是0.7~2.5GHz。可以看到,相比传统的CPU产品和技术,这个选择和调节的范围是非常大的,显示了Intel强大的CPU产品和软件设计能力。
核心的设计和执行频率直接影响CPU产品的功耗和散热设计。提高CPU运行的频率,是提升CPU性能的最简单的方式,就是提高运行频率。但这显然不是无代价的,主要的代价就是发热的问题。此外,更高的功率,还会带来电源支持和能源消耗的问题,也不符合人类社会绿色环保的整体发展理念。所以现代先进CPU产品的设计,不再片面强调CPU的主频和性能,而是更加强调能效指标,特别是自动适应计算负载,按需消耗电能,减少无效的能源消耗的能力。
Intel 155H的基础功耗为28W,最大睿频功耗为115W,最小和最大保证功耗分别为20W和65W。笔者的理解,这个最大保证功耗应该就是以前的TDP热设计功耗。结点温度(TJUNCTION)为110°C。
因此155H就是一个65W级别的CPU产品。属于一个中等偏上的定位。
AI支持
和其诞生的时代相关,15代Intel酷睿CPU的最大特性,其实是增加了对AI处理的支持。这大概就是Intel将其新一代酷睿处理器增加了一个Ultra形容词的原因吧。为什么不脸皮厚一点,直接叫Core AI Process呢?
155H提高的相关AI特性和技术包括:
- Intel® Deep Learning Boost (Intel® DL Boost) on CPU
Intel® Deep Learning Boost (Intel® DL Boost) 是Intel的深度学习计算加速技术。是为AI深度学习计算的场景进行的设计和优化。它使用新的矢量神经网络指令集(Vector Neural Network Instruction,VNNI)对Intel AVX-512指令系统进行了扩展,从而显著提升了深度学习计算的性能。通常这个优化和实现是在GPU上实现的,Intel的这一技术,在CPU上就有实现,可以提供更灵活方便的应用方式。
- NPU
NPU就是神经网络处理单元。不知道是不是跟Apple学的,Intel也在自己的CPU产品中,增加了NPU单元。Intel的NPU技术品牌名称为"Intel AI Boost"。
Intel的NPU支持的AI数据类型包括Int8,FP16,FP32等,支持的AI软件框架包括OpenVINO™, WindowsML, DirectML, ONNX RT等。提供稀疏支持(Sparsity Support,SSP)特性,可以大幅度提高AI计算的内存使用效率。当然,不出意外的,还是无法支持CUDA。
Intel的NPU还提供Windows Studio Effects支持,这是微软在Windows 11中引入的一个音频处理技术。就是提供了如空间声音、回声消除、自动音量平衡、动态范围压缩等声音处理相关的硬件加速特性,可以理解称为软件化和可扩展的音频DSP系统。用于增强和改善如视频会议、音视频播放、游戏等的音频体验。
笔者理解,使用NPU在芯片级的层面上来改善音视频体验的方式,最早还是由Apple来引领的,因为它有独特的条件和需求。它有自有的硬件、芯片、操作系统和软件可以支撑这种独特的设计和实现。Intel作为作为一个通用的CPU厂商,引入NPU产品,其实有一些劣势,就是它不掌握上游在操作系统和应用软件层面的资源。所以它主要和微软合作,走的还是Wintel的老路。但除了多媒体方面,NPU在AI其实有更大的发展前景,这应该也是Intel在这方面大力投入的一个更重要的原因吧。
图形处理单元
面对新的技术发展机遇和市场需求(就是AI),Intel在这一代的CPU内置GPU单元方面,进行了一个很大的改进和提升。就是使用了原来在Intel独立显卡中使用的架构和技术:ARC。
ARC(学名Intel® Arc™ graphics,锐炫)是Intel在2022年才发布的独立显卡产品线。当然这并不是Intel第一次涉足独立显卡业务,前面的几次尝试,基本上都是以失败而告终,这一次正在进行中,看起来也不是很乐观,毕竟它的竞争对手Nvidia和AMD在GPU技术领域相对而言也过于强大了。
就技术而言ARC也还算中规中矩,毕竟独立显卡不仅仅是看芯片,驱动、软件支持和生态体系的因素可能更加重要一点,而且是一个长期的过程。大体的规格,ARC只能对标于Nvdia的中端产品RX30系列,只能说给了市场一个更具性价比的产品和选择。
其实从另外一个角度而言,Intel也有一个非常强大的GPU产品,但它们都是以集成显卡的形式存在的,Intel自己称为iGPU。这个产品也随着Intel CPU产品的发展而一直在发展,而且还很有自己的一些特点。比如其显示驱动和视频编解码功能非常强大,这也是普通PC用户使用最广泛的场景和需求。
本来在正常情况下CPU和GPU是两个相对独立的产品类别。本来都在各自的领域平稳发展,但最近的AI技术大爆发可能打破了这个平衡。更加适应AI计算的GPU相关技术的需求一下被大大的提升了,让所有的芯片厂商必须要在这个方面有所发展,才能有效的保证自己的市场地位。这应该就是Intel基于将更先进的GPU架构ARC下放到新一代CPU产品中的一个原因。
作为本来为独立显卡系统设计的ARC GPU架构,显然比Intel原有的iGPU产品线有很多的提升。它的主要规格是:
- 显卡最大动态频率: 2.25 GHz
- 图形输出支持:DP2.1 UHBR20, HDMI2.1
- Xe-core:8
- 支持光线追踪
- 最大分辨率 8K/60Hz
- 软件:DirectX 12.1,OpenGL 4.6,OpenCL 3.0
- 硬件编解码: H.264、H.265、AV1、VP9
ARC同样提供了CPU一样的AI特性,包括Intel DL Boost,AI数据类型和更多的AI软件框架包括OpenVINO™, WindowsML, DirectML, ONNX RT, WebGPU等。
由于引入了ARC显卡技术,按照Intel自己的说法,其显卡效率和性能有了大幅提升。其中功耗节省提升高达25%,AI 效率提升高达70%,生成式 AI 速度更快。显卡性能提升高达2倍。
在系统中,ARC GPU的设备代码为 0x7D55。
扩展性
155H支持 Intel Thunderbolt 4;PCI-E 5.0和4.0,具体为1 (x8) Gen5 + 3 (x4) Gen4 + 8 (x1,x2,x4) Gen4;PCI Express通道数为28。
笔者理解,这里的扩展性支持主要是CPU直接支持的方式,其他外围设备比如USB、SATA等,都是从PCI-E总线再次扩展来实现的。这些内容主要取决于芯片组和主板设计,和CPU没有直接的关系。
内存
这一点可能是这个产品最无趣的地方了。基本上没什么亮点。最大支持96GB内存,基本上只能用于桌面或者移动系统。内存规格是DDR5 5600 MT/s或者LPDDR5 7467 MT/s,支持两个通道,不支持ECC。
其他先进技术
普通用户可能认为Intel的CPU产品就是一个中央处理器,但可能不熟悉的是,经过长时间的积累和发展,Intel CPU集成了很多先进的特性和技术,涉及很多多媒体、系统管理、性能优化和加速、系统安全等方面,这里以155H为例,简单例举几条。
- Instruction Set 指令集: 64-bit
- Intel® Thread Director, 硬件线程调度器
- Intel® Image Processing Unit 6.0, 英特尔® 图像处理单元
- Intel® Smart Sound Technology, 英特尔® 智音技术
- Intel® Wake on Voice, 英特尔® 语言唤醒
- Intel® High Definition Audio, 英特尔® 高质音频
- Intel® Adaptix™ Technology, 系统微调和自适应
- Intel® Speed Shift Technology, 工作负载瞬态响应
- Intel® Turbo Boost Max Technology 3.0 , 英特尔® 睿频加速 Max 技术 3.0 ‡
- Intel® Hyper-Threading Technology, 英特尔® 超线程技术
- Thermal Monitoring Technologies, 温度监控
- Intel® Flex Memory Access,灵活内存访问
- Intel® Volume Management Device (VMD), 高级存储管理
- 新的指令集扩展包括:Intel® SSE4.1, Intel® SSE4.2, Intel® AVX2
- 英特尔® vPro® 基础版, 一个商业计算系统认证和标准
- 英特尔® Threat Detection Technology (TDT), 威胁检测技术
- 英特尔® Standard Manageability (ISM) , 远程可管理性
- 英特尔® Hardware Shield 参与资格, 硬件安全和固件保护
- 英特尔® 控制流强制技术, 一种系统攻击防护
- 英特尔® AES-NI, 新的AES指令
- 安全密钥
- 英特尔® Trusted Execution Technology, 可信任执行技术
- 执行禁用位,减少病毒和恶意代码攻击的机会
- 英特尔® Boot Guard, 启动保护
- 基于模式的执行控制 (MBEC), 内核代码完整性验证和强制
- 英特尔® 虚拟化技术 (VT-x)
- 英特尔® Virtualization Technology for Directed I/O (VT-d) ,改进的虚拟化IO
- 英特尔® VT-x with Extended Page Tables (EPT) ,改进的虚拟化内存管理
SOC
虽然在Intel的CPU规格说明中,没有明确的提到,但其他的资料和材料表面,以155H为代表的MeteorLake产品系列,是一个SOC(System On A Chip)产品。就是它实际上是一个模块化的系统,由Compute(计算)、Graphics(图形)、SoC(控制和集成)、IO(输入输出)等部分构成(下图)。
随着芯片技术的发展,现代化的CPU设计和制造,都倾向于发展成为功能更加丰富强大丰富的SOC系统,从而获得在性能、功耗、集成性和功能性方面的好处,并且简化外部集成时的工作和成本。
MetrorLake处理器就是这样设计和制造的。它还在制造工艺上引入了Chiplet(芯粒)技术。就是即使是同一个芯片,它的不同的组成部分,不一定要在同一个工厂内一次性完成,而是可以将大的芯片划分为多个小的芯片区块。这些区块可以在不同的工厂使用不同的制造工艺来完成。
具体而言,如上图所示,MeteorLake SOC由四个不同的区块(Tile)组成,SoC块是主要组件,包括了一些基本功能;计算块中主要是P和E核心;GPU块就是ARC GPU模块;I/O块包括了外部设备接口。其中SoC是由Intel4工艺制造,它其实是Intel的首个7纳米工艺;而其他块是由台积电制造的,还使用了N6和N5两个工艺。芯粒的制造工艺,可以大幅度降低芯片的制造成本,因为并不是所有的功能模块都需要最先进的制程,而且不同的芯片代工厂,可以都有它们擅长的领域,这样可以做到优势互补,制造的成本和效益综合的最大化。
在更新的设计中,Intel甚至考虑模仿苹果,将内存模块都集成起来(下图)。如果这个是真的,显然这个设计和实现的技术含量距离苹果还是有一段距离的。因为苹果是在设计阶段,直接将统一内存单元都做到了芯片里面,而不是像下图,在封装阶段,将内存模块封装在一个底板之上,两者还是有很大区别的。
小结
本文分析和探讨了Intel新一代的CPU产品155H,展开分析了其涉及到的一些技术和特性,并加入了笔者关于现代CPU体系设计,技术发展和行业现状的一些思考和想法。