Arm Cortex-A320
安谋科技
半导体芯片研发生产商
+关注
已关注
已点赞
点赞
转发
已收藏
收藏

详解 Arm Cortex-A320,针对物联网优化的超高能效 Armv9 CPU

安谋科技 安谋科技 2025年08月08日 11:30 



图片


本文转载自:Arm 社区


Arm社区

Arm与其生态系统的创新、深刻独到的行业与技术洞察、以及Arm全球社区的最新动态分享平台。

服务号


在当前持续演进的物联网 (IoT) 环境中,软件复杂性不断增加,边缘设备因而需要更胜以往的性能、能效和安全性。Arm® Cortex®-A 系列产品通过为功率有限的设备带来先进的计算功能,进而满足这一需求,并为多样化的市场提供增强的人工智能 (AI) 处理能力、强大的安全性和优化的能效。Cortex-A3xx 系列专为包括消费类电子设备和云服务等在内的各种细分市场提供超高能效解决方案和优化的性能。更重要的是,该系列 CPU 为快速增长的高度多样化物联网市场提供了性能强劲且可扩展的解决方案,使其成为#边缘AI 应用的理想之选。


边缘 AI 需要更卓越的计算性能、更强大的安全性,以及更出色的软件灵活性。随着软件愈发复杂化,Armv9 架构应运而生,以提供先进的#机器学习 (ML) 和 AI 功能,并具备增强的安全特性。该架构现已在 Cortex-A3xx 的超高能效系列实现,为新一代边缘 AI 应用夯实根基。


Cortex-A320:最小型的 Armv9 架构实现

Arm 发布的 Cortex-A320 是首款基于 Armv9 架构的超高能效 Cortex-A 处理器。这是一款基于 Armv9.2-A 架构的 AArch64 CPU。其微架构源自 Cortex-A520,并经过显著优化,以改善面积和功耗。


Cortex-A320 的能效相较 Cortex-A520 提高了 50% 以上。这一提升是通过多次微架构的更新而实现,其中包括窄取和解码数据路径、密集存储的 L1 缓存、缩减端口的整数寄存器文件等优化。 


得益于高能效的分支预测器和预取器,以及内存系统的提升等微架构上的显著创新,Cortex-A320 在 SPECINT2K6 基准测试中的标量性能相比其前代产品 Cortex-A35 提升了 30% 以上。 


更重要的是,通过集成增强的Armv9 的 Neon 和 SVE2 向量处理技术,在 INT8 通用矩阵乘法 (GEMM) 中测得 Cortex-A320 的 ML 处理能力比 Cortex-A35 高出至多 10 倍。此外,通过对 BF16 等新的数据类型、新的点积和矩阵乘法指令的支持,Cortex-A320 的 ML 性能比目前全球最受欢迎的 Armv8-A CPU Cortex-A53 高出至多六倍。


Cortex-A320 在 ML 能力的大幅提升,以及极高的面积能效比,使其在 ML 应用中成为最高能效的 Cortex-A CPU 核心。 


与 Arm Cortex-M 处理器相比,Cortex-A320 的 ML 性能同样提高了数倍。例如,在 GEMM 性能方面,Cortex-A320 相较目前性能最高的 Cortex-M CPU (Cortex-M85) 提高了八倍。这种性能提升不仅归功于 Armv9 架构在 AI 处理上的增强,还源于 Cortex-A320 内存访问性能的大幅提高和频率的增加。 


与此同时,得益于 Arm 的 A 处理器架构、多核执行,以及灵活的内存管理,这使 Cotex-A320 成为 Cortex-M 系列微处理器进行性能升级的合适选项。 



通过微架构优化,实现更高能效

Cortex-A320 是一款单发射、32 位指令取指的有序执行 CPU,实现了优化的八级管线,且具有紧凑的转发网络,从而达到比 Cortex-A520 更高的频点。 


Cortex-A320 提供从单核到四核配置的集群内扩展。该 CPU 所采用的简化 DynamIQ Shared Unit (DSU) DSU-120T,可支持仅使用 Cortex-A320 的集群。DSU-120T 是最小的 DSU 实现,能够显著降低复杂性、面积和功耗,进而大幅提升基于 Cortex-A 的入门系列产品的能效。 


图片


Cortex-A320 支持高达 64KB 的 L1 缓存和高达 512KB 的 L2 缓存,并且具有可连接到外部存储器的 256 位 AMBA5 AXI 接口。L2 缓存和 L2 TLB 可以在 Cortex-A320 CPU 之间共享,而实现 Neon 和 SVE2 SIMD 技术的向量处理单元既可在单核复合体中专用,也可在双核或四核实现中由两个核共享。 



针对不同市场的多样化优势

得益于广泛的开源 Linux 支持、强大的安全生态系统,以及 Armv9 架构所取得的关键进展,Cortex-A320 可确保与边缘侧和基础设施设备兼容,同时具备出色能效和可扩展性。 


Neon 和 SVE2 向量处理技术更新提升了 ML 性能,除此之外,Armv9 架构还大大增强了安全性,这对于物联网和嵌入式系统至关重要。Cortex-A320 为 Cortex-A 的超高能效系列引入了重要的安全特性,包括增强内存安全性的内存标记扩展 (MTE),以及可减少跳转导向编程和返回导向编程攻击的指针验证 (PAC) 和分支目标识别 (BTI)。 


Secure EL2  是 Cortex-A320 所采用的其中一项 Armv9 关键特性,通过增强 TrustZone 中的软件隔离,有助于在边缘设备上安全执行软件容器。


从入门级通用 MPU、智能扬声器、软件定义智能摄像头,到工厂车间内的自动驾驶车辆、自动化边缘 AI 助手、AI 人机界面和机器人控制器,Cortex-A320 可在广泛的应用中发挥上述优势。除边缘 AI 应用外,Cortex-A320 还可惠及包括智能手表和智能可穿戴设备,以及服务器基板管理控制器 (BMC) 等基础设施设备在内的众多关键细分市场。 


Cortex-A320 也非常适合于以往使用高性能 Cortex-M 的应用,如电池供电的 MCU 用例或运行实时操作系统 (RTOS) 的应用,这些应用需要通过对称多处理来扩展性能,而 Arm 的 A 处理器架构开箱即支持。 


此外,它还可用于需要 Cortex-A 内存管理或地址转换特性的 RTOS 应用,以增强软件的灵活性。

推荐
来自安谋科技