ARM公司从成立以来,一直以知识产权(IP,Intelligence Property)提供者的身份出售知识产权,在32位RISC CPU开发领域中不断取得突破,其设计的微处理器结构已经从v3发展到现在的v7。ARMv7架构是在ARMv6架构的基础上诞生的。该架构采用了Thumb-2技术,它是在ARM的Thumb代码压缩技术的基础上发展起来的,并且保持了对现存ARM解决方案的完整的代码兼容性。Thumb-2技术比纯32位代码少使用31%的内存,减小了系统开销,同时能够提供比已有的基于Thumb技术的解决方案高出38%的性能。ARMv7架构还采用丁NEON技术,将DSP和媒体处理能力提高了近4倍。并支持改良的浮点运算,满足下一代3D图形、游戏物理应用以及传统嵌入式控制应用的需求。此外,ARMv7还支持改良的运行环境,以迎合不断增加的JIT(Just In Time)和DAC(DynamicAdaptlve Compilation)技术的使用。
Cortex系列处理器是基于ARMv7架构的,分为Cortcx-M3、Cortex-R和Cortex-A三类。ARM Cortex-M3处理器是为存储器和处理器的尺寸对产品成本影响极大的各种应用专门开发设计的;ARM Cortex-R系列处理器目前包括ARM Cortex-R4和ARM Cortex-R4F两个型号,主要适用于实时系统的嵌入式处理器;而ARM Cortex-A8处理器是一款适用于复杂操作系统及用户应用的应用处理器。
Cortex-A8是ARM公司有史以来性能最强劲的一款处理器,主频为600MHz到1GHz,在65纳米工艺下,其功耗低于300毫瓦,而性能却高达2000MIPS。
其结构如图:
Cortex-A8采用了复杂的流水线构架,针对强调功耗的应用,Cortex-A8采用了一个优化的装载/存储流水线,顺序执行,同步执行的超标量处理器内核,其拥有13级主流水线,10级NEON多媒体流水线,可以提供2 DMIPS/MHZ的性能;它有优化的L1缓存,可以提高访存储问速度,并降低功耗;它有专用的L2缓存,在编译的时候,可以把缓存当作标准的RAM进行处理,而缓存大小可以灵活配置,缓存的访问延迟也可以编程控制;它有基于执行记录的动态跳转预盼,这不仅提供高达95%准确性,而已也提供重放机制以有效降低预判错误带来的性能损失;
在技术方面,使用了能够带来更高性能、功耗效率和代码密度的Thumb?-2技术。它首次采用了强大的NEONTM信号处理扩展集,对H.264和MP3等媒体编解码提供加速。Cortex-A8解决方案还包括Jazelle?-RCT Java加速技术,对实时(JIT)和动态调适编译(DAC)提供最优化,同时减少内存占用空间高达三倍。此外,新处理器还配置了用于安全交易和数字版权管理的TrustZone?技术和AMBA? 3 AXI?互连协议,而且实现低功耗管理的IEM功能。
不仅如此,针对Cortex-A8,ARM公司专门提供了新的函数库(Artisan Advantage-CE)。新的库函数可以有效的提高异常处理的速度并降低功耗。同时,新的库函数还提供了高级内存泄漏控制机制。
在高性能的90纳米和65纳米工艺下,Cortex-A8处理器运行速度最高可达到1GHz,从而满足高性能消费产品设计的需要,而这一切也使之成为实现下一代应用性能的最佳选择。
二、TI OAMP35x处理器的特点
德州仪器(TI)日前宣布推出四款新型 OMAP 处理器,采用最新上市的ARM Cortex-A8 内核技术,在单一芯片中实现了手持式功率级中堪比笔记本电脑的高性能功能组合。最新 OMAP35x 处理器进一步丰富了 TI 业经验证的领先无线手机技术,能够帮助主流客户满足新市场领域的要求,如车载应用、消费类设备、嵌入式以及医疗设备等。这种集成的单芯片处理器将照片级真实感 (photo-realistic) 图形效果与 TI 高级视频 DSP 技术相结合,在市场上各种单芯片组合中提供了最佳的集成多内核处理功能。这些革命性突破的应用处理器必将有助于 OEM 厂商针对重新定义用户界面、网页浏览、工作效率以及多媒体体验标准。
TI 的 OMAP35x? 处理器系列基于 ARM?Cortex?-A8 内核,由四款超标量应用处理器组成,提供了业界最佳的通用、多媒体和图形处理单芯片组合。Cortex-A8 是一款超标量内核,提供了超出 ARM9 四倍的性能提升。TI OMAP35x处理器系列共包含 OMAP3503、OMAP3515、:OMAP3525 以及 OMAP3530四款不同的单芯片处理器,其发展路线和主要特性如下两图:
1 OMAP3503:面向嵌入式主板运算处理的应用处理器
OMAP3503 应用处理器包含一个 ARM Cortex-A8 内核,集成了丰富的外设集,Cortex-A8 内核的时钟速度比 300MHz ARM9 提高了一倍,也因此实现了两倍性能的提升。由于采用弹性架构,OMAP3503再度提升两倍性能,能在单一处理器内支持指令级并行技术,从而在时钟速率不变的情况下加快了 CPU 吞吐量。Cortex-A8 的性能翻了两番,达到 1200 Dhrystone MIPS,从而能够运行 Windows Embedded CE 与 Linux 等全功能操作系统。它不仅能够帮助用户更快存取数据库、数据手册、电子表格、演示文件、电子邮件以及音视频附件,还可提高 网页浏览与视频会议等应用程序的运行速度。该处理器还支持更快的启动时间与Java 应用,非常适合嵌入式处理器电路板。
2 OMAP3515:面向游戏或便携式导航系统的应用
OMAP3515 应用处理器拥有与 OMAP3503 同样丰富的外设集和 ARM 内核,同时还附带有首次广泛提供的集成 OpenGL ES 2.0 图形引擎。基于 Imagination Technologies PowerVR SGX 图形加速器的 OMAP3515 可在手持设备上展现拥有 PC 游戏质量的图形,每秒可提供的多边形高达 1 千万个,能实现照片级真实感的图形效果,从而大幅增强了智能设备的用户界面。OMAP3515 是嵌入式游戏或简单便携式导航系统的理想处理器。
3 OMAP3525:面向嵌入式应用的多媒体处理功能
OMAP3525 应用处理器拥有与 OMAP3503 同样丰富的外设集和 ARM 内核,同时还附加集成达芬奇技术,用于音频、视频和成像,更能满足高清视频、影像、音频以及多媒体加速功能的需求。OMAP3525 是市场上首款能够在 500mW 以下提供高清解码的应用处理器。集成的达芬奇技术是硬件启用的视频和成像处理技术,加上专门的视频中心外设,能使 OMAP3525 以 720p、30fps 实现 MPEG-4 SP 高清视频解码。OMAP3525 是多媒体和视频应用的理想选择,将为用户带来新的性能标准,因此非常适合使用于便携式媒体播放器。。
4 OMAP3530:面向多媒体智能设备的单芯片解决方案
OMAP3530 应用处理器是一个扩展集器件,它将 OMAP3503、3515 和 3525 的所有特性合并于单一的芯片上。OMAP3530在单芯片上集成了 ARM、DSP、图形引擎、达芬奇技术以及丰富的外设集,因此能够满足高性能需求、低功耗工作与娱乐性应用。作为理想适用于因特网设备与便携式病人监护设备等各种潜在应用的处理器,OMAP3530 在针对电源而优化的设计中提供了高集成度特性,因而能够以更轻薄时尚的外形带来各种新型诱人应用。另外,全新用户接口与图形功能还有助于更方便地集成至现有的商业或消费类产品设计中。因此借助 OMAP3530,OEM 将能够向用户交付高性能、低功耗的娱乐应用。
为了提高该性能等级的产品对嵌入式应用的吸引力,OMAP35x 处理器还支持在电量极为有限的环境下运行有关应用。为了实现这种功耗等级,OMAP35x 处理器集成了三种技术。首先,处理器架构采用多内核设计,这样每个内核都能专注处理各自负责的任务,从而实现效率最大化。其次,该处理器采用 65 纳米低功耗工艺制造而成。最后,该产品采用 TI 的 SmartReflex技术,能根据设备工作情况、工作模式、工艺技术以及温度变化等因素动态控制电压、频率与功耗。
这些处理器提供了多种组件结合的不同解决方案,其中包括 Cortex-A8 内核、丰富的多媒体外设、符合 OpenGL ES 2.0 标准的图形引擎、视频加速器以及TMS320C64x+ DSP 内核。专为以视频为中心的客户设计的达芬奇软件技术,更可运用在最高视频性能的OMAP3525 与 OMAP3530中。由超过400多家公司组成的TI Developer Network也能提供从操作系统实施到应用用户接口的丰富专业技术,以支持最新OMAP35x 处理器的开发工作。上述应用处理器还支持12MP相片捕获功能,且引脚对引脚兼容,因此能够帮助 OEM 厂商在单一平台的基础上方便高效地创建完整产品系列。基于前代 ARM器件及 C64x+ DSP 开发的软件也能与 OMAP35x 处理器的内核相兼容。