&">nbsp; Bulldozer架构的推出并不算是AMD在处理器架构设计领域的一次冒险之举。在此之前IBM/Intel等公司曾推出过其它几款宽位执行SMT产品,而这次的Bulldozer只是在这些SMT设计的基础上进行了谨慎的改良化设计。
在处理器设计领域,改良型的方案通常要比彻底的改革方案效果更好。许多风格激进的改革派设计方案如安腾,奔腾四Netburst,IBM Cell等均很快战死沙场,反而是许多改良型的设计方案最终赢得了胜利。
从渐进式改良的观点看,AMD这次为Bulldozer加入四个整数执行单元可谓改良幅度较大。这样的改良当然需要对处理器内部的其它功能单元进行许多微调和重新设计的配合才能充分发挥作用,比如缓存容量,缓存联合路书,缓存延迟参数,指令缓冲区的大小,资源分区策略,解码器带宽等等。虽然在设计新处理器时通常都需要面对这些参数的调整,但对AMD而言仍然需要冒很多风险,一般在设计成熟的过程中,设计人员会逐步对这些参数进行调整,但留给Bulldozer的时间已经不多了,AMD的Bulldozer处理器很快便会上市,因此在这方面AMD不能够出现任何的差错。
不过,让Bulldozer产品如期上市,并且能够对Intel的产品在性价比,性能/功耗比方面形成较大的威胁,还算不上是AMD的终极目标。
在进一步探察Bulldozer内部架构之前,我们必须要看清楚的是,尽管AMD方面想极力撇清自己的产品与SMT的相似之处,并将他们的方案自称为“第三种多线程处理器设计”,但是Bulldozer其实质其实是以SMT为基础的一种改良设计。
Bulldozer是AMD最新的突破
Bulldozer芯片的基本构建块是AMD所谓的“模块”,带有一个有自己L1缓存的单线程四通道的整数单元。这个模块中2个这样的整数单元,以及2个128位浮点计算单元;所有4个这单元共享指令集和解码单元,以及共享的L2缓存、共享的L3缓存和共享的北桥来连接到外围设备。这样2个Bulldozer就有一个共享的浮点调度器和两个整数调度器;如果整数单元空闲的话,这个四核芯片就可以在一个时钟频率内执行4个双精度或者8个单精度读点运算。