MCPLive > 杂志文章 > 百核战役即将打响 Llano架构简析

百核战役即将打响 Llano架构简析

2011-07-18姑苏飘雪《微型计算机》2011年6月下

Llano APU技术亮点解析

由于架构上的变化不大。此次Llano让我们真正关注的地方主要集中在产品性能优化方面—比如引入更先进的32nm制造工艺、更强大的GPU性能,以符合AMD异构融聚发展策略的推进计划。

1、AMD第一款32nm处理器

AMD在处理器架构设计理念和升级能力方面上不输甚至领先竞争对手,然而在处理器生产技术上AMD总是落后半拍。这并不能完全怪AMD,毕竟在剥离了制造工厂以后,AMD已经是一家纯粹的芯片设计公司。伴随Llano的到来,AMD也将正式跨入32nm的时代。

作为AMD第一款32nm处理器产品,Llano APU采用Global Foundries的32nm SOI高K金属栅极工艺,包含11个铜金属层和低K电介质、基于硅锗的拉伸硅、第二代沉浸式光刻技术。对半导体芯片来说,新的制造工艺往往可以带来运算性能和电气性能两方面的改进。一个非常简单的事实就是,同样的半导体芯片,若用先进工艺制造往往可以带来功耗的明显降低,而低功耗又意味着芯片的性能可以继续向上提升,这在过去的实践中也得到极好的例证。或许考虑到这是首次引入32nm制造工艺,为了降低新工艺所带来的风险,Llano的CPU核心架构没有像Zacate和Ontario那样采用新的Bulldozer架构,而是基于目前极为成熟的Phenom Ⅱ架构。这个代号为Husky的核心采用双核或四核设计,每个核心将配备1MB的独立二级缓存。它并不具备共享的三级缓存,因此在单纯的CPU理论测试中恐怕难以有颠覆性的表现。不过,APU的设计思路本身就是以CPU+GPU的异构计算来弥补单纯CPU计算性能的不足,这也注定了Llano在GPU方面将相当给力!

Llano架构图(左)与Sandy Bridge架构图(右)的对比

2、GPU规格相当给力

相对来说,Llano所融合的GPU充分显示了AMD的野心—Llano将采用Radeon HD 6500系列GPU的改进产品,根据规格的不同,它将拥有160/320/400个数量不等的流处理器单元。理论上,其图形性能可以达到Radeon HD 5500/5600系列的水准—绝对是史上强的集成显卡!如果你觉得这还不够,它还可以与任意一款Radeon HD 6000系列的独立显卡组成CrossFireX。凭借强大的GPU性能,至少在图形性能上,英特尔的Sandy Bridge难以望其项背。

Llano还有两个Sandy Bridge无法比拟的优势:一是支持DirectX 11;二是支持AMD Eyefinity技术。DirectX 11比它的胞兄DirectX 10更酷更性感,通过一系列的增强改进让DirectX 10那些很少有人问津的特性变得更加平易近人。虽然Llano支持DirectX 11并不能带来实质的性能飞跃,但AMD并不想将这个先机让给英特尔。对于游戏娱乐来说,Llano显然比Sandy Bridge更有诱惑力。

更加重要的是,图形芯片技术的不断提升已不再局限于3D应用,拜新的DirectX 11以及OpenCL所具备的通用计算开发功能,越来越多的应用也可以借助GPU实现硬件加速运算,例如常用的Picasa或者Google Earth等都是活生生的例子。虽然Llano所融合的GPU在流处理器数量上较中高端显卡仍有一定距离,但是并行计算性能已经比CPU要强大很多—Llano拥有500GFlops的理论浮点计算能力,超算性能较传统CPU提升400%,这将使得采用Llano的笔记本电脑上网加速性能提升300%,办公加速性能提升200%!利用GPU强大的浮点性能以及并行处理能力提升软件运行速度,这已经成为未来软件开发的潮流,未来也将会有更多应用程序采用图形加速技术。这也是AMD为何提出“百核加速,异构计算”概念,并彻底改变传统研发思路的关键原因。另一方面,AMD的Eyefinity技术已经成为了业内独树一帜的特有技术。如今一款基于Llano APU的笔记本电脑能够少支持三屏显示,这对于打算需要多屏应用的商务人士来说可是个好消息。而且,Llano提供了一个PCI-E 2.0 x16通道,可以自行配置,让用户实现更灵活的多屏输出;并支持HDMI 1.4、DisplayPort 1.2等标准规范和蓝光3D立体技术。

3、三大新技术控能耗

随着制造工艺越来越先进,芯片的动态功耗越来越低,但是晶体管电流泄漏却越来越大。因此,采用新的设计流程来减小电流泄漏显得十分重要。当前减小电流泄漏有几个常用方法:一个就是核心内工作频率较低的电路上使用漏电小的标准元件(编者注——元器件漏电率跟频率基本成正比)。另一个就是对晶体管衬底增加偏置电压,使得阈值电压增加,从而降低漏电。再有就是多电源供给方案,将一部分电路的供电在不需要使用的时候直接关闭。就像时钟门控技术一样,当核心没有数据运算的时候,将核心的频率降低直至终关闭核心,以减小动态功耗。

为了减小电流泄漏,英特尔在Nehalem上开始引入“功率门限(Power Gate)”这个概念,可让处理器在低负载的情况下能够几乎完全关闭空闲核心以降低功耗及减少漏电,该技术还能动态提高激活核心的频率,这也就是睿频加速技术的本质。现在Llano也将支持这种技术,AMD称之为“Core Power Gating”(核心功率门限)。借助“Core Power Gating”技术,Llano可以单独控制某个CPU核心的工作电压,并在侦测到核心空闲后将此核心深度休眠甚至直接关闭,大限度节约电能,让Llano可以在极短的时间内迅速切换CPU的工作状态。或许你想象中Power Gating的原理似乎很简单,但在实际设计中要实现这一技术对处理器厂商却是一个非常艰巨的挑战,只不过我们并不需要关心这些问题。无论如何,Core Power Gating技术看上去应该是相当成功的——AMD宣称借助Core Power Gating技术,Llano的漏电电流将减少至之前的十分之一甚至更低。

Llano还引入了数字APM模块和功率感知时钟网格设计两项全新的处理器节能技术,对功耗的管理比以往更科学、更精确,也更全面。正是有这三大技术的“护航保驾”,Llano APU的能耗控制相当优秀—据称,Llano可为笔记本电脑续航时间带来30%以上的提升,实现高达8小时的电池使用时间。

分享到:

用户评论

用户名:

密码: