【ARM Cache 系列文章 9 番外篇 -- ARMv9 系列 Core 介绍】

文章目录

    • [ARMv9 系列Core](#ARMv9 系列Core)
      • [ARM Cortex-A510 介绍](#ARM Cortex-A510 介绍)
      • [ARM Cortex-A715](#ARM Cortex-A715)
      • [ARM Cortex-A720](#ARM Cortex-A720)

ARMv9 系列Core

2021年5月Arm公布了其最新3款CPU和3款GPU核心设计,三款新CPU分别是旗舰核心Cortex-X2、高性能核心Cortex-A710、高能效核心Cortex-A510 CPU,三款新GPU核心则覆盖高中端和入门级。

这是继2021年3月推出重要的创新------全新64位指令集Armv9、2021年4月推出基于Armv9的首个产品------面向数据中心的Neoverse N2之后,Arm首次展示基于Armv9设计的一系列面向消费级移动设备市场的新核心,这些新设计不仅性能大幅提升,而且增加新的安全性和人工智能(AI)功能。

  • Cortex-X2,它是Arm Cortex-X定制项目的一部分,允许合作伙伴帮助为其特定用例设计专用核心。作 为Cortex-X1 的继任者,它也是Arm CPU产品线中强大的设计,可以用于笔记本电脑等大屏设备。Arm称,与Cortex-X1比,Cortex-X2的性能将提高16%,机器学习性能提升2倍;
  • Cortex-A710 "big" 核心 比 Cortex-A78 提高10%的性能、30%的能效、2倍的机器学习性能;
  • Cortex-A510 "LITTLE" 高能效核心 取代自2017年推出的Cortex-A55设计。与老款A55相比,其性能提升35%,能效提高20%,机器学习性能提升3倍。

高通骁龙888芯片,即采用 Arm Cortex-X1 和Cortex-A78的部分定制版本作为其四个"大"核心,并使用Cortex-A55设计作为其"LITTLE"核心。

X2、A510都将是纯64位,不再兼容32位,而A710会继续支持OL0 AArch32。其中,X2和A710的前端都改进了分支预测,精度更高,错误更少。

凭借 L3 缓存和丛簇设计 DSU-110 的特性,单一丛簇(cluster)最多可容纳8个X2 核心,并具有最大 16MB 的 L3快取能力。

ARM Cortex-A510 介绍

Cortex-A510是一个更大的微体系结构跳跃,因为它代表了Arm的 Cambridge CPU 设计团队的一项新的 CPU设计。A510 在改进 IPC的同时仍继续关注功率效率,并且也许最有趣的是,它保留了其有序的微体系结构特征。

A510则采用了一个混合核心微架构merged core microarchitecture )新设计,可将2个A510组合成一个群组,单一CPU可由多个群组构成,从而实现更加弹性化的结构设计。两个核心对它们共享L2缓存系统以及它们之间的FP / NEON / SVE pileline。

ARM 的 Merged-Core Microarchitecture 是 ARM 设计的新型微架构。这种微架构的主要特点是将多个物理核心合并为一个逻辑核心,以提高处理器的能效和性能。

在Merged-Core Microarchitecture中,每个物理核心都可以独立运行指令,但是所有的物理核心都共享同一个指令流。这样,当某个物理核心空闲时,它可以被用来执行其他核心的指令,从而提高整体的处理器性能。

ARM Cortex-A715

2022年8月 Arm又推出了他们的大核Cortex-A715(也称为 Makalu)。A715 支持与 ARMv9.0 ISA 大致相同的几项增强功能。更关键的是,A715的所有Exception Level都是仅支持AArch64(完全放弃了 32 位支持)。A715 的设计原则与之前的大核心相似:以更高的比率提高性能,而不是影响功率和面积。在这次迭代中,性能重点放在了整体改进上,而没有显着拓宽pipeline 或extending its depth。最后,Arm 工程师引入了受早期 Cortex-X 设计启发的有针对性的改进,例如分支预测器和预取增强功能。

A715 的另一项改进是引入了 3 阶段预测方案以实现快速周转。以前,Arm 具有快速的 L0 0 周期预测和较慢的 2 周期预测结构,而在 A715 中,Arm 将其分解为三个阶段,采用新的 1 周期周转中间结构,从而减少了获得预测的延迟。

随着更高容量的分支预测器产生更高的分支请求带宽,可能会遇到更多获取两个单独指令流的实例。为了适应这一点,A715 现在支持更高的指令高速缓存查找带宽,最高可达标签/周期的两倍。

ARM Cortex-A720

推荐阅读: Cortex-A720

推荐阅读
https://aijishu.com/a/1060000000365445

相关推荐
海滩游侠15 小时前
ARM assembly: Lesson 10
arm开发
Eternal-Student16 小时前
arm-伪指令
arm开发
Eternal-Student16 小时前
everyday_question dq20240731
开发语言·arm开发·php
Tlog嵌入式2 天前
蓝桥杯【物联网】零基础到国奖之路:十六. 扩展模块之矩阵按键
arm开发·stm32·单片机·mcu·物联网·蓝桥杯·iot
Q8343158192 天前
华为 海思22AP10(SS524)H.265 编解码处理器用户指南
arm开发·人工智能·嵌入式硬件·音视频·硬件工程·h.265·视频编解码
星羽空间2 天前
win11下 keil报错Cannot load driver ‘D:\Keil_v5\ARM\Segger\JL2CM3.dll‘
arm开发·keil
日晨难再2 天前
AMBA:APB的历史(从APB1到APB5)
arm开发·arm·硬件工程·fpga·数字ic
Tlog嵌入式3 天前
蓝桥杯【物联网】零基础到国奖之路:十八. 扩展模块之光敏和AS312
arm开发·stm32·单片机·mcu·物联网·蓝桥杯·iot
汽车电子助手3 天前
【STM32开发环境搭建】-4-在STM32CubeMX中新增Keil(MDK-ARM) 5的工程目录(包含指定路径的C和H文件)
c语言·arm开发·stm32·stm32cubemx·keil
海滩游侠3 天前
ARM Assembly 6: Shift 和 Rotate
arm开发