为什么寄存器比内存快?

   计算机的存储层次(memory hierarchy)之中,寄存器(register)最快,内存其次,最慢的是硬盘。


  同样都是晶体管存储设备,为什么寄存器比内存快呢?


  Mike Ash写了一篇很好的解释,非常通俗地回答了这个问题,有助于加深对硬件的理解。下面就是我的简单翻译。

  原因一:距离不同

  距离不是主要因素,但是最好懂,所以放在最前面说。内存离CPU比较远,所以要耗费更长的时间读取。

  以3GHz的CPU为例,电流每秒钟可以振荡30亿次,每次耗时大约为0.33纳秒。光在1纳秒的时间内,可以前进30厘米。也就是说,在CPU的一个时钟周期内,光可以前进10厘米。因此,如果内存距离CPU超过5厘米,就不可能在一个时钟周期内完成数据的读取,这还没有考虑硬件的限制和电流实际上达不到光速。相比之下,寄存器在CPU内部,当然读起来会快一点。

  距离对于桌面电脑影响很大,对于手机影响就要小得多。手机CPU的时钟频率比较慢(iPhone 5s为1.3GHz),而且手机的内存紧挨着CPU。

  原因二:硬件设计不同

  苹果公司新推出的iPhone 5s,CPU是A7,寄存器有6000多位(31个64位寄存器,加上32个128位寄存器)。而iPhone 5s的内存是1GB,约为80亿位(bit)。这意味着,高性能、高成本、高耗电的设计可以用在寄存器上,反正只有6000多位,而不能用在内存上。因为每个位的成本和能耗只要增加一点点,就会被放大80亿倍。


  事实上确实如此,内存的设计相对简单,每个位就是一个电容和一个晶体管,而寄存器的设计则完全不同,多出好几个电子元件。并且通电以后,寄存器的晶体管一直有电,而内存的晶体管只有用到的才有电,没用到的就没电,这样有利于省电。这些设计上的因素,决定了寄存器比内存读取速度更快。

  原因三:工作方式不同

  寄存器的工作方式很简单,只有两步:(1)找到相关的位,(2)读取这些位。

  内存的工作方式就要复杂得多:

  (1)找到数据的指针。(指针可能存放在寄存器内,所以这一步就已经包括寄存器的全部工作了。)

  (2)将指针送往内存管理单元(MMU),由MMU将虚拟的内存地址翻译成实际的物理地址。

  (3)将物理地址送往内存控制器(memory controller),由内存控制器找出该地址在哪一根内存插槽(bank)上。

  (4)确定数据在哪一个内存块(chunk)上,从该块读取数据。

  (5)数据先送回内存控制器,再送回CPU,然后开始使用。

  内存的工作流程比寄存器多出许多步。每一步都会产生延迟,累积起来就使得内存比寄存器慢得多。

  为了缓解寄存器与内存之间的巨大速度差异,硬件设计师做出了许多努力,包括在CPU内部设置缓存、优化CPU工作方式,尽量一次性从内存读取指令所要用到的全部数据等等。

时间: 2024-08-29 11:41:08

为什么寄存器比内存快?的相关文章

汇编语言--寄存器(内存访问)

内存中字的存储 在cpu中,用16位来存储一个字,高8位存放高字节,低8位存放低位字节.在内存中时,由于内存单元是字节单元,刚一个字要用2个地址连续的内存单元来存放,字的低位字节存在低地址单元.  字单元--存放一个字型数据(16位)的内存单元,由两个地址连续的内存单元组成,高地址内存单元中存放字型数据的高字节,低地址内存单元存放单元中存放字型数据的低位字节 0地址单元中存放的字节型数据为20H,0地址单元中存放的字型数据为4E20H,2地址单元中存放的字节型数据为12H,2地址单元中存放的字型

开发一个Linux调试器(三):寄存器和内存

上一篇博文中我们给调试器添加了一个简单的地址断点.这次,我们将添加读写寄存器和内存的功能,这将使我们能够使用我们的程序计数器.观察状态和改变程序的行为. 系列文章索引 随着后面文章的发布,这些链接会逐渐生效. 准备环境 断点 寄存器和内存 Elves 和 dwarves 源码和信号 源码级逐步执行 源码级断点 调用栈展开 读取变量 下一步 注册我们的寄存器 在我们真正读取任何寄存器之前,我们需要告诉调试器一些关于我们的目标平台的信息,这里是 x8664 平台.除了多组通用和专用目的寄存器,x86

汇编语言实验1-实验平台、理解寄存器和内存

本文为<汇编语言程序设计>配套实践.点击链接-进课程主页. 1. 实验目的 学会搭建汇编语言程序设计的软件平台 学会Debug实用程序的基本功能 对汇编指令.寄存器.内存空间产生直观的认识 2. 实验任务 任务0-搭建汇编语言实验环境 参考视频"0105 汇编语言实践环境搭建",搭建汇编语言实验环境,以便于下面的工作. 如果使用的winXP,可以不安装DOSBOX模拟器,而是用XP的MS-DOS方式运行masm文件夹中的命令. 任务1-Debug程序的使用 参考视频&quo

【汇编语言/底层开发】3、通过寄存器进行内存访问

上篇叙述了8086CPU的通用寄存器和代码寄存器的一些东西.仅仅这些是远远不够的,显而易见的一个原因是,如果CPU只是对自己内部的寄存器进行操作,不能同外部数据进行交互,那么将无法完成任何工作. 数据段寄存器DS: 8086CPU中的DS寄存器专门用来存放准备访问的数据的段地址.[n]则表示一个偏移地址,这个偏移地址同DS中表示的段地址一起确定最终要访问的内存地址. 以下汇编语句表示从10000H地址中的数据读入寄存器AL中: MOV BX, 1000 MOV DS, BX MOV AL, [0

内存屏障机制及内核相关源代码分析

1.--->ymons 在www.linuxforum.net Linux内核技术论坛发贴问:set_current_state和__set_current_state的区别? #define __set_current_state(state_value) /do { current->state = (state_value); } while (0) #define set_current_state(state_value) /set_mb(current->state, (st

Android内存优化

在前公司做一个图片处理的应用时, 项目交付的时候,客户的手机在运行应用的时候,一直在崩溃,而这个异常就是OutOfMemory的错误,简称为OOM, 搞得我们也是极其的崩溃,最后 ,我们是通过网上搜集资料和代码走查的方式来优化解决的,这里,我就把我们收集到资料和总结的经验分享下吧.    Android的虚拟机是基于寄存器的Dalvik,它的最大堆大小一般是16M,有的机器为24M.我们平常看到的OutOfMemory的错误,通常是堆内存溢出.移动开发和web开发的最大的区别是设备资源受限,对一

JVM内存管理 (转)

一.物理内存与虚拟内存1.物理内存                (1)RAM        所谓物理内存就是我们通常所说的RAM(随机存储器).        (2)寄存器        在计算机中,还有一个存储单元叫寄存器,它用于存储计算单元执行指令(如浮点.整数等运算时)的中间结果.寄存器的大小决定了一次计算可使用的最大数值.        (3)地址总线        连接处理器和RAM或者处理器和寄存器的是地址总线,这个地址总线的宽度影响了物理地址的索引范围,因为总线的宽度决定了处理器

C语言CPU与寄存器的简单介绍

一.CPU的组成 CPU分为 4大组件,分别为: 寄存器 控制器 运算器 时钟 可以暂存一些值,存储数据(相当于CPU中的内存) 控制寄存器的读写和更换等操作 辅助单元,是协调者 时钟就是决定CPU运算速度的 在这四个组件中,我们程序员日后使用最多的就是寄存器了,所以接下来会重点放在寄存器上. 二.寄存器 现代计算机的CPU的寄存器大致会有以下几种类型,还是用一个表格来表示 累加器 标志寄存器 程序计数器 基址寄存器 做累加运算最快 用32位空间来记录CPU的各种状态,如第四位 ZERO 的标志

理解 Memory barrier(内存屏障)【转】

转自:http://name5566.com/4535.html 参考文献列表:http://en.wikipedia.org/wiki/Memory_barrierhttp://en.wikipedia.org/wiki/Out-of-order_executionhttps://www.kernel.org/doc/Documentation/memory-barriers.txt 本文例子均在 Linux(g++)下验证通过,CPU 为 X86-64 处理器架构.所有罗列的 Linux 内