当前位置:首页 > 科技资讯 > 正文

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮

随着制造商不断推出性能卓越的微控制器,我们越来越难以清晰区分MCU和微处理器之间的界限。

早在2022年,Arm公司推出Cortex-M85内核时,就有工程师评论道:“尽管Cortex-M85属于Cortex-M系列,但其性能已经超越了早期的Cortex-A处理器。未来的M85内核设备不仅仅是一款单片机,更可以视为一款微应用处理器。”

最近,芯片厂商开始大力推广基于M85的MCU产品,这些新品确实展现出堪比MPU的强大能力。它们有哪些突出特点?EEWorld今天将为您详细解析。

深入剖析M85的核心优势

性能是Cortex-M85最直接且显著的优势之一。

作为首款支持超过6 CoreMarks/MHz且超过3 DMIPS/MHz的Cortex-M处理器,M85通过Arm Helium技术,在数字信号处理和机器学习任务上相比前代M7实现了高达4倍的提升。这种卓越的标量性能得益于微架构层面的多项创新,包括优化的双发射和选择性三发射机制、改进的分支预测能力,以及增强的内存系统(如数据预取功能)等。

根据Arm的观点,面对日益增长的计算需求,Cortex-M微控制器系统的开发者面临选择:是优化软件以从现有微控制器中挖掘更多时钟周期的处理能力,还是将代码迁移到性能更高的微处理器架构?Cortex-M微控制器具有多重优点,包括确定性执行、短中断延迟和先进的低功耗管理模式。若转向Cortex-A处理器,则意味着可能牺牲部分Cortex-M的固有优势。因此,Cortex-M需要推出一款性能如此“震撼”的产品。

简而言之,就是为了满足开发者“既要高性能,又要低成本、低功耗和易开发”的复合需求,在保留MCU优点的同时提供媲美MPU的性能。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第1张

内存系统架构是M85的另一大亮点。

M85配备了紧密耦合内存的低延迟内存系统,确保了确定性操作。该架构为SoC设计人员提供了四个32位数据TCM接口和一个64位指令TCM接口,所有接口均集成错误校正码功能。新增的32位AHB访问接口端口允许外部DMA控制器与M85处理器内核并发访问TCM,从而支持多种常见的数据流处理场景。

M85内存系统还包含配备ECC的一级缓存,通过AMBA 5 AXI主接口连接外部存储器,即使在面对低速非确定性内存访问时仍能保持性能优化。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第2张

安全性则是M85的又一个重要卖点。

M85引入了Armv8-M架构的TrustZone技术,同时成为首款集成Armv8.1-M指针验证与分支目标识别扩展的Cortex-M处理器,显著降低了开发者达成PSA安全认证2级的门槛。PACBTI通过验证函数调用与返回地址,为抵御面向返回和面向跳转的软件攻击提供了增强防护。

总之,M85带来的前所未有的性能水平为MCU开发者开辟了新天地,当时各大厂商也纷纷表示准备跟进。不过,产品更新换代并非一蹴而就,且M85的定位也需要时间明确。而现在,M85或许正迎来其爆发的关键时刻。

意法半导体(ST)强势出击

ST近日推出的STM32V8,在EEWorld社区引发了广泛讨论。这款产品是STM32系列微处理器中性能最高的型号之一,其EEMBC CoreMark评分达到了惊人的5072,甚至超过了STM32N6。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第3张

18纳米制程、800MHz Cortex-M85内核、4MB相变存储器、MVE——这些关键词充分体现了该产品的强大实力。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第4张

根据ST的介绍,仅通过升级至M85内核,新产品在实时控制应用的标量数学运算性能上就提升了20%;与基于Cortex-M7的产品相比,在同主频下性能提升了3.5倍;依赖DSP功能的应用性能增幅更是高达300%到400%。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第5张

其卓越性能得益于采用的18纳米FD-SOI PCM工艺,该工艺与汽车MCU Stellar系列相同。FD-SOI技术与同样提供高性能运算的FinFET形成竞争。在MCU领域,这属于相对新兴的应用,不仅使STM32V8实现了更高的运行速度,还显著优化了功耗效率。

PCM作为一种嵌入式非易失性存储器技术已发展出多种形态,包括英特尔已停产的3D XPoint内存,其以速度著称。由于嵌入式闪存技术难以突破,MCU一直受限于40纳米制程节点。为了缩小制程,业界开始关注新型存储器。

PCM是与MRAM、FRAM、RRAM竞争的一种存储技术。PCM提供了最小的存储单元,可以在尽可能小的单位面积上实现比以往一倍以上的信息存储量提升,从而带来物理优势,实现最小的存储区。在不改变成本的情况下,它能将整体存储容量提升一倍,这无疑进一步提高了成本效益。

更重要的是,与MRAM和FRAM相比,ST的PCM具备额外优势:支持最高140℃的工作温度,其抗辐射等特性使之既能适用于航天领域,也能满足严苛的工业及汽车应用需求。因此,STM32V8的一个重要应用方向就是航天领域。

该系列芯片支持最高4MB的ePCM与1.5MB RAM,片外串行存储器接口包括八线SPI和十六线SPI,可支持串行NOR闪存、HyperRAM、PSRAM以及就地执行操作。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第6张

AI能力的大幅提升是STM32V8的另一大优势。它通过Arm Helium M-profile向量扩展技术奠定了AI能力的基础。Helium作为基于打包单指令多数据和单元素标量指令的Arm数学架构,支持整数与浮点数运算,涵盖8位至64位整型操作及128位向量中的16/32位浮点运算。该技术为高性能微控制器带来了增强的机器学习与数字信号处理能力,Arm还将MVE封装成适用于C/C++开发的函数库与代码生成工具。

伴随新品发布,ST还升级了其边缘AI产品线的AI模型库。该模型库汇集了经过预训练的AI模型,覆盖多种AI应用场景。这些模型专为适配意法半导体AI微控制器产品组合而优化,可加速边缘AI开发进程。据官方介绍,模型库现有140余个模型,应用范围涵盖可穿戴设备、智能摄像头与传感器、安防设备及机器人等设备所需的视觉、音频与感知功能,支持PyTorch、TensorFlow、RSCI框架、LiteRT及Onex格式模型开发。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第7张

STM32V8还有其他一些细节上的升级,包括:集成Chrom-ART图形加速器、TFT LCD控制器及JPEG加速器;千兆以太网控制器支持时间敏感网络,同时配备FD-CAN、高速USB和HDMI-CEC等接口;包含12位ADC与DAC接口以及两组SAI与四组I2S音频接口;涵盖安全存储、安全启动与安全调试支持;配备唯一身份标识与防篡改机制,并通过PSA Level 3与SESIP 3安全认证。

瑞萨电子更早布局

瑞萨电子对于M85的布局更早,并且产品更新异常勤奋和频繁。

2023年10月,瑞萨推出了业界首款基于Arm Cortex-M85处理器的RA8系列MCU——RA8M1,其CoreMark评分突破3000分,并能满足客户应用所需的完全确定性、低延迟及实时操作要求。根据瑞萨的说法,6.39 CoreMark/MHz的性能水平,将使系统设计人员能够使用RA MCU替代应用中常用的MPU。

当时,瑞萨的第一代RA8主要围绕M85内核扩大产品线,这款产品采用480MHz M85搭载Helium MVE,在存储方面尚未采用新型存储器,搭载1MB到2MB闪存和1MB SRAM。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第8张

今年6月,瑞萨在官网悄然上线了“全球最强MCU”RA8P1系列。

第二代的RA8将工艺提升到22纳米ULL工艺,搭载了新型存储器0.5/1MB MRAM,主频也随之大幅提升,M85内核的主频达到了1GHz。相比之下,RT1170采用的则是28纳米FD-SOI制程工艺。

根据瑞萨的介绍,相较于闪存,MRAM具备更快的写入速度、更高的耐用性和更强的数据保持能力。不仅如此,为了追求更好的AI性能,第二代的RA8还集成了Ethos-U55 NPU和另一颗250MHz的M33内核。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第9张

在推出RA8P1的同时,瑞萨也同步推出了RA8D2,这款产品同样搭载了1GHz的M85内核以及新型存储器MRAM。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第10张

今年10月,瑞萨继续迭代,推出1GHz RA8T2 Cortex-M85微控制器,集成MRAM与EtherCAT赋能工业电机控制。该产品集成1MB MRAM、2MB带ECC校验的SRAM,同时为双内核分别配置256KB和128KB紧耦合内存,并支持SiP封装扩展至8MB外部闪存。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第11张

紧接着没几天,瑞萨又为RA8系列新增两款产品RA8M2和RA8D2,并且还刷新了跑分,达到了惊人的7300 CoreMark。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第12张

瑞萨表示,RA8M2和RA8D2搭载的嵌入式MRAM,相较闪存技术具备多重优势——高耐用性与更强的数据保持能力、更快的写入速度、无需擦除操作、支持字节寻址,同时具备更低的漏电流和制造成本。对于要求更高的应用,还提供单个封装中带有4或8MB外部闪存的SIP选项。此外,这两款MCU均包含千兆以太网接口和双端口TSN交换机,可满足工业网络应用场景的需求。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第13张

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第14张

可以说,最近的瑞萨真的是在死磕高算力MCU,而且为了让MCU的制程更高、性能更强,还同时专注于MRAM技术的研发。

Arm Cortex-M85高性能MCU:模糊与MPU的界限并引领AI边缘计算新浪潮 Cortex-M85  高性能MCU STM32V8 瑞萨RA8系列 第15张

总结与展望

从M85内核融入MCU开始,我们几乎难以区分这是MCU还是MPU。显然,这些布局是为了应对AI时代的挑战,AI确实为产品升级提供了巨大动力。

而M85正以超越传统MCU的极致性能与异构集成能力,重新定义高性能嵌入式系统的边界,引领MCU迈向“算力无界”的新纪元。

参考文献

[1]Arm:https://developer.arm.com/community/arm-community-blogs/b/internet-of-things-blog/posts/introducing-cortex-m85

[2]All About Circuits:https://www.allaboutcircuits.com/news/stmicro-unveils-first-18-nm-mcu-for-high-performance-designs/

[3]Electronic Design:https://www.electronicdesign.com/technologies/embedded/article/55332065/electronic-design-stmicroelectronics-stm32v8-utilizes-fd-soi-and-phase-change-memory

[4]ST:https://www.st.com/resource/en/product_presentation/stm32v8-presentation.pdf

[5]Renasas:https://www.renesas.cn/