刚刚结束的Hot Chips 21让我们看到了不少即将推出的处理器以及最新的技术,从中观察我们不难发现,多核技术已经是未来服务器处理器不可逆转的潮流,而除了尽量增加核心数量之外,大缓存、高内存扩展性也是下一代的服务器芯片的一大特点。
在服务器处理器芯片市场上紧追英特尔的AMD在热门芯片研讨会上讨论并展示了于明年">正式发布的12核Magny-Cours (马尼库尔)处理器,据了解该处理器的命名源自法国马尼库尔赛道,其法语的发音非常类似于英文的“many cores”(多核心)。
英特尔却并未在此次研讨会上透露太多信息,部分是因为随后举行的英特尔自己筹划的为期两天的会议以及于今年9月22至24日举行的英特尔官方大型展示会英特尔开发者论坛(Intel Developer Forum)。尽管如此,研讨会上人们还是能一窥将于今年晚些时候正式发布的英特尔下一代高端处理器Nehalem-EX的真容。
无论是AMD的Magny-Cours还是英特尔的Nehalem-EX都采用了大容量的缓存,前者的三级缓存为12MB而后者的更是拥有24MB的超大级缓存。和上一代的“伊斯坦布尔”和至强7400相比较而言,缓存有着双倍的增长。
英特尔工程师Sailesh Kottapalli讨论了Nehalem-EX中的环状架构(ring architecture),指出这并非用于英特尔即将推出的GPU产品Larabee。用于Larabee的这种简单的布局结构连接着所有的缓存器代理 ,以此来降低延迟提升带宽。而用于Nehalem-EX的环状架构是双向性的,这将核心之间的带宽提升了四分之一。Nehalem-EX采用了简单的旋转式协议,核心间数据通讯每次围绕着类似于公交车路线的环状运动。这种架构是可以拓展的,正如Sailesh Kottapalli所言,“新核心的加入致使带宽也随之拓展”。
AMD公司一位官员于近日透露,即将推出的代号为“Magny-Cours”的12核处理器的功耗和目前的六核处理器一致,但是处理器主频有所削减。
AMD的12核服务器处理器“Magny-Cours”借鉴了英特尔早期在多核处理器芯片上合二为一的原理,将两颗六核“伊斯坦布尔”处理器封装在一起。技术人员Pat Conway在斯坦福大学举行的热门芯片研讨会(Hot Chips conference)上表示,12核处理器“Magny-Cours”和六核“伊斯坦布尔”处理器的功耗相同,但是处理器主频有所削减,此外还加入了电源管理特性。
AMD12核“Magny-Cours”架构图
尽管如此Pat Conway拒绝回应有关12核处理器“Magny-Cours”主频的疑问。Conway只是称,“我们决定把这个细节留给产品公布之际”。据悉,“Magny-Cours”锁定服务器产品,将会于2010年第一季度发布。
Magny-Cours采用了多芯片模块设计(multi-chip module,MCM),而这是AMD曾长期挖苦英特尔早期至强处理器中的设计,遥想当初AMD曾表示这并未真正意义上的多核心处理器。Magny-Cours处理器有着两个六核封装,两个封装有更为快速的全新HyperTransport接口连接。尽管如此AMD在研讨会上还是为其采用多芯片模块设计做辩解,声称原生12核心处理器热量太大,AMD希望将Magny-Cours的热度范围控制保持与六核心处理器一致。
内存接口也在扩展,这些芯片将会被有着32GB或者64GB内存的服务器系统采用,Magny-Cours有着四个HyperTransport端口以及四个内存通道,而Nehalem-EX在单芯片上有着两个内存控制器轮流控制存储缓冲器,支持两个DDR3内存通道。
Magny-Cours通过采用一项名为“HT Assist”的特性来提升速度,而这并未先例,目前已经被“伊斯坦布尔”处理器所采用。预留出的1MB的三级缓存会被当做系统中所有高速缓存行的索引使用,因此当一个核心需要特定数据之时,无需探测处理器中的每一个缓存,仅仅在缓存索引中就可以确定所需数据的位置。
考虑到传统的提升处理器主频来提升性能的方法会导致过多的热耗散以及功耗,在过去的若干年间诸如英特尔和AMD的芯片制造商重返通过增加处理核心来提升芯片性能的道路。
尽管主频有所削减,但是和当前皓龙处理器芯片相比12核处理器“Magny-Cours”依旧能够带来不菲性能提升。更大的缓存和更多的处理核心数量使服务器系统运行得更快。有着数量众多处理核心的服务器系统在虚拟化环境中能够更为快速地处理任务,此外还能让服务器寄宿更多的虚拟机。
随后Conway还谈论了“Magny-Cours”出色的细节。构成该芯片的两颗六核“伊斯坦布尔”处理器由四个超线程互连连接,目标锁定双路和四路服务器系统。“Magny-Cours”有着总计12MB的三级缓存,每个处理核心支持512KB的二级缓存,据了解该芯片将会采用45纳米工艺技术,由AMD拆分后的GlobalFoundries制造。
此外AMD还在致力于研发代号为“Bulldozer”的x86芯片架构,2011年32纳米工艺的处理器芯片将会采用该架构。按照计划代号为“Interlagos”的16核处理器将会于2011年发布。
早期的皓龙处理器需要探测每一个核心和缓存来寻找数据,在四核处理器系统中这带来了费用的增长,在六核心以及十二核心系统中这事无法接受的,因此缓存索引也就孕育而生。