改善嵌入式系统性能 多内核处理器架构

处理器的设计正在从提高频率向降低功耗的方向转变,为满足更高性能的要求并使功耗不超过许多应用所能承受的范围,微处理器的一个明显变化是从频率越来越高向多内核架构转变。本文分析这种转变对嵌入式">系统设计的性能带来哪些改善。

  双内核微处理器是当前计算设计关注的焦点,为满足更高性能要求并使功耗不超过许多应用所能承受的范围,微处理器正在从频率越来越高的发展趋势向多内核架构转变。

  其它的一些重要进展也专注于提供更高的单位功耗上完成的指令数量的指标上,例如片上存储器控制器、更先进的动态功率管理(DFM)以及单指令多数据(SIMD)引擎。

  在过去几年,改善工艺和晶体管技术是提高处理器性能的主要方法,而更高频率则是获得更高性能的驱动力。然而,最近关注焦点从频率转移到功耗上。

  是什么促使关注焦点发生变化?一直以来,设计工程师主要考虑的功率问题是由门电路充放电引起的AC分量。半导体技术向90nm和更小工艺尺寸的转移,引入了重要的DC功率分量(又称漏功率或者静态功率)。实际上,相同电压下90nm设计的典型漏电流大约为130nm设计的2到3倍,漏电流引起的功耗可能占到某些90nm器件总功耗的一半以上。

  更低功率的产品采用低功率工艺制造,例如绝缘硅(SOI)技术。SOI能减少寄生电容,使开关频率提高25%或者使功耗降低20%。将功率更低、介电常数k值更高的介质材料用作栅极绝缘体(gate insulator)的相关工作也在进行中,这将获得比目前使用的二氧化硅层更易于制造且更厚的层。

  更高频率的器件需要更高的电源电压,因而其功耗也呈指数增长。更高频率的处理器还会增加中断等待时间,这对8208.html">实时应用来说非常关键,并需要给内核提供更深的管线。当处理器执行一条未曾预设的指令时,管线将会拥塞造成执行停止,这会对性能造成严重影响。

  还有其它因素迫使芯片设计工程师通过新方法提高性能。更高的频率需要额外的时钟开销,处理器需要在时钟边沿附近建立一定的安全裕量以确保正确运行。因为安全裕量近似保持不变,所以随着频率的增加,在一个时钟周期内可用的时间实际上会更少。因此,增加频率并没有使性能得到相应提高。

  这样以来,系统设计工程师转向多内核处理器架构而不是更高频率的器件来实现系统性能的提高,并使功耗的增加最小。双内核微处理器最初设计用于服务器等计算密集型应用,现在则用于广泛的嵌入式应用中。

  存储器控制器和桥接芯片也与多个内核一起集成在单个硅片上。存储器子系统一直以来就是高性能处理系统的一个瓶颈,存储器技术的最新发展,包括引入第2代双倍数据速率(DDR2)接口,已使性能有了显著提高。相比单倍数据速率(SDR)技术133MHz的传输速率,DDR2的传输速率高达667MHz。但是,因为处理器时钟速率增加得更快,所以人们已开始更多地关注存储器的响应时间。

  直到最近,包括存储器控制器在内的许多系统逻辑都以北桥和南桥芯片的形式存在于处理器外部。将存储器控制器和桥接芯片集成到同一个硅片内作为微处理器内核,可减少带宽和响应时间的瓶颈。例如,片上存储器控制器将使处理器到存储器的等待时间减少2/3到3/4。

  某些时候更重要的是,这样的集成可节省电路板空间。更高的集成对在像高级夹层卡(Advanced Mezzanine Cards, AMC)这样小的尺寸内提供更强处理能力来说尤其重要。更好的存储器控制可节省功率。当没有数据要处理以及不需要进行刷新时,更智能的存储器控制器可以使时钟使能信号无效,这样避免产生不必要存储器时钟,一般可以降低高达20%的存储器功耗。

  另外一个可用来减少存储器芯片及其终结电阻功耗的系统设计技术是,当它们以集束形式(clustered arrangement)连接在一起时,利用处理器进行远端引导和控制。高速互连/网络方案,比如RapidIO技术,能通过处理器节点到架构的连接,完全控制处理器节点。这样可消除用于引导程序的闪存,以及用来驱动复位和中断的各种可编程逻辑器件,从而节省功率和电路板面积。

  像以太网控制器这样的传统装置现在似乎具有这样的基本功能,即在没有额外闪存的情况下启动基于FTP的引导程序。在数字用户线接入复用器(DSLAM)应用中,消除每个线卡上的闪存对32线的DSLAM来说可节省大约3W的功率。

  处理器的数据输入和输出是提高系统性能的另外一个关注焦点。先进通信计算架构(AdvancedTCA)等新规范也推动着片上高带宽管线的发展,支持通过背板上几个高性能互连的能力是AdvancedTCA的关键优势。到目前为止,每个这样的互连都需要外部芯片。

  现在设计用于AdvancedTCA的处理器具有片上高带宽管线,无需外部器件就可实现从背板到处理器的千兆位以太网、串行RapidIO和PCI-Express的直接连接,这在功率、电路板面积、开发时间和系统成本方面提供了最佳解决方案。

  在芯片上集成这样的接口还允许优化内核和接口之间的处理。例如在千兆以太网模块中,接口硬件可以以线速执行一些早期的分析和分类,将不同类型的帧送到不同的缓冲池,并将头帧传输到2级缓存以便更快地被微处理器内核处理。这种方法通过在接口和内核之间建立一个处理管线,大大减轻了内核的负担。

  嵌入式设计工程师可利用各种节省处理器功率的机会。例如,动态频率切换(DFS)允许软件在一个时钟周期内显著地改变处理器运行时的内核频率,它无需插入空周期或者对器件进行复位,且处理器仍保持完整功能。这样一般可节省45%的功率。

时间: 2024-09-26 02:00:40

改善嵌入式系统性能 多内核处理器架构的相关文章

《stm32嵌入式系统开发实战指南》一1.1 ARM内核处理器沿革

1.1 ARM内核处理器沿革 ARM(Advanced RISC Machines)是微处理器行业的一家知名企业,1991成立于英国剑桥,该公司主要出售芯片设计技术的授权.人们将采用ARM技术知识产权(IP)核的微处理器称为ARM 微处理器.ARM公司利用独特的商业模式在全球范围内拥有极其广泛的合作伙伴.ARM公司将其技术授权给世界上许多著名的半导体.软件和OEM厂商,每个厂商得到的都是ARM公司提供的一套独一无二的ARM相关技术及服务,这些合作伙伴又保证了大量的开发工具和丰富的第三方资源.利用

嵌入式设备linux内核版本的选择

问题描述 嵌入式设备linux内核版本的选择 有好多的嵌入式方案都是以2.x为主 国内公司一般跑linux qt的都是2.x 3.x在国内的资料没那么全 性能肯定好点 不知你要用那个架构的主控 解决方案 公司的话最好用成熟一点的,学习的话可以学新一点的. 解决方案二: 这个没多大选择余地,取决于你之前用的版本,稳定性,兼容性 解决方案三: 一般3.0 3.10 这些都是比较稳定 解决方案四: 现在好多都用3.0以上的版本了

AMD公布推土机、山猫两款全新处理器架构更多技术细节

8月22-24日,第22届HotChips高性能芯片大会在美国加州帕洛阿尔托市的http://www.aliyun.com/zixun/aggregation/13438.html">斯坦福大学隆重举行.IBM.英特尔.AMD.Oracle等多家巨头齐聚一堂,各自公布了自己的最新成就.会议上提到的像是硅光子技术.AMD新处理器架构等都是业界关注的话题. AMD公司在最近召开的HotChips会展上终于透露了其新款分别面向服务器和移动市场的Bulldozer和Bobcat处理器产品的有关细节

AMD公布处理器架构 压路机将取代推土机

美国处理器厂商AMD日前公布旗下最新一代处理器架构Steamroller(压路机),用于服务器和个人电脑等设备等级的处理器产品. AMD技术总监Mark Papermaster在Hot Chips会议上介绍新架构时表示,Steamroller将延续AMD前一代代号为Bulldozer(推土机)的处理器设计架构,并更新整数运算核心的编译器设计. 原有单颗处理器模组所内建的1组编译器,将新增为2组,让2个整数运算核心可以独立使用. 在Steamroller架构中,在1个AMD处理器核心模组中就将内建

AMD全新处理器架构“推土机”性能提升50%

虽然整个产业都对AMD的全新处理器架构"推土机"(Bulldozer)望眼欲穿,都期待它能带来一次性能上的爆发,全面抗衡Intel,但是尽管推土机架构特点鲜明,性能提升的幅度看起来其实很有限. AMD服务器与工作站产品http://www.aliyun.com/zixun/aggregation/32064.html">市场总监John Fruehe在官方博客中透露:"从性能的角度看,如果将16核心英特拉格斯(Interlagos)核目前的12核心Optero

微软明年发布自主品牌平板机 基于Intel Oak Trail处理器架构

微软http://www.aliyun.com/zixun/aggregation/32086.html">首席执行官史蒂夫·鲍尔默(Steve Ballmer)在今天的财务分析会上指出,微软计划在军平板机市场大展拳脚,2011年将发布自主品牌平板机,采用Intel即将发布的"Oak Trail"处理器架构.除了推出自主品牌Windows 7平板机外,微软还有很多"得力助手".包括东芝.富士通.宏碁.华硕.索尼.联想.戴尔和三星在内的OEM厂商也将在

ARM 处理器架构【转】

ARM 处理器架构 转自:http://www.arm.com/zh/products/processors/instruction-set-architectures/index.php ARM 架构是构建每个 ARM 处理器的基础.ARM 架构随着时间的推移不断发展,其中包含的架构功能可满足不断增长的新功能.高性能需求以及新兴市场的需要.有关最新公布版本的信息,请参阅 ARMv8 架构. ARM 架构支持跨跃多个性能点的实现,并已在许多细分市场中成为主导的架构.ARM 架构支持非常广泛的性能

ARM Cortex-A15处理器架构与iPad3性能/配置前瞻

随着2012年3月7日的临近,关于苹果新一代iPad的消息也越来越多,不过相对以往的各种猜测五花八门的盛况不同,此次新一代iPad的很多具体的功能和性能参数的预测消息已经比较统一,这是因为这些功能在iPad2发布之前苹果就早有准备,例如Retina级别的屏幕达到2048x1536分辨率,已经在iPhone4S上使用的Siri等等.但最近争议较大的是,最新的处理器是苹果A6,或是 A5X.今天,我们也抱着一颗八卦的心,又以科学严谨的态度,来预测一下iPad3配置到底是哪样啊?理论上说,下文绝对不是

Windows CE嵌入式导航系统研究(内核相关)

1.1 嵌入式车载导航系统的软件设计流程 嵌入式车载系统软件主要包括系统内核.驱动程序.应用程序三部分.设计的过程当中,我们采用瀑布模型进行设计,首先制定Windows CE5.0系统内核,再次编写相关设备驱动,最后编写或移植应用程序. 制定内核时,我们采用SunSaung2440 BSP(板级支持包)进行制定,同时提交组建保证系统支持网络通讯.文件系统.CAB包安装.汉语支持等功能.不仅如此,为方便系统应用程序开发,内核制定之后,我们发布相应的SDK. 图 5.1 软件设计流程 1.2 Win