现在,挑战即将来临,AMD准备祭出的Zen架构貌似具有巨幅的性能提升,加上AMD原本具有的图形性能优势,Intel不可避免感受到新一轮大战来临的气息。同时,无论是苹果还是联想、HP、戴尔这些PC厂商,它们的产品线都到了更新换代的关口。Intel第七代Core架构“KabyLake”也因此备受瞩目,它也是我们接下来要分析的对象。

Kaby Lake的14纳米+工艺

我们知道,Intel的Tick-Tock工艺、架构两步走策略已经实施很多年了,过去按照第一年更新架构,次年就同架构升级制造工艺,接下来一年再更新架构,如此交替稳步进行。这种方式很稳妥,保证了工艺良率,产品性能也能够持续地提升。

2016110100036

14纳米+的Kaby Lake晶圆

2016110100037

Kaby Lake的芯片核心布局图,集成了CPU、图形核心、内存控制器以及I/O功能。

14纳米+工艺:更好的晶体管性能

但是到了14纳米阶段,Tick-Tock模式就出现问题了,本来在今年,Intel就应该切换到10纳米阶段,这个过程显然不太顺利。Intel仍然需要依靠成熟的14纳米工艺来解决问题,为此,Intel将产品线更新换代分为工艺、架构、优化三步走的方案,更新周期从过去的24个月延长到36个月,这就意味着性能提升的脚步不可避免变得更慢,Intel也必须在优化工作上下更多的工夫。

CPU架构部分,Kaby Lake继承了Sky Lake核心、也就是第六代Core架构,所以光从IC设计角度来看,Kabylake的CPU性能实际上是止步不前的。唯一不同之处在于,Intel对14纳米工艺进行改良升级、号称14纳米+,新工艺拥有更好的晶体管性能。Kaby Lake的晶体管性能比前代产品提升了将近12%,这给它带来了更出色的能效表现。

2016110100038

Kaby Lake与前几代Core架构的能耗对比。

再来看看Intel给出的对比表,如果以2010年的第一代Core架构为参照物,当时能耗最低的移动处理器功耗为18瓦,到了第四代架构时,功耗降低到11.5瓦,能效提升高3.5倍;而到第六代Core,能耗进一步降低到4.5瓦,能效提高了整整八倍!那到了现在的kaby lake,虽然最低能耗保持在4.5瓦,但性能提升显著,能效比的提升幅度达到了10倍!也就是相对于现在的第六代Core,Kaby lake的能源效率提升了20%。

增强的Speed Shift技术:加快响应速度

在第六代Core架构中,Intel引入了一项名为“Speed Shift”的电源管理技术,它主要改进了系统的突发响应时间。Intel过去一直采用SpeedStep移动电源管理技术,配合操作系统,可以根据工作负载的不同、动态地调节处理器的工作频率和能耗,从而达到节能的目的。但这项技术的缺点是必须经过操作系统,频率的切换速度较慢、最快也得30毫秒。Speed Shift技术很好地解决了这个问题,它绕过了操作系统、让处理器能够直接与电源控制单元沟通,并将所有电源状态都开放给操作系统,三者配合之下,SpeedShift平台最快可以在1毫秒的时间内完成状态切换。

2016110100039

Speed Shift带来更快的频率切换响应。

不过,第六代Core架构的SpeedShift只针对原先的节能机制,Intel还有一项睿频(turbo boost )技术,它的逻辑刚好与SpeedStep相反——睿频可以在CPU面对高负载应用下将运行频率提高数百个MHz,达到加速运行的目的。不过第六代Core的睿频切换延迟需要接近100毫秒,而现在Kaby Lake平台也对此作出改进,新一代SpeedShift技术可以让睿频状态的加速延迟降低到5毫秒。

要说明的是,是否开启Speed Shift,CPU的性能基准都是一样的,它的功能在于能够大大提高不同负载的切换速度,从而将性能效率提升最多20%。

更高频率带来显著性能提升

体现在最终产品上,就是Kaby Lake可以在同等功耗时工作在更高的频率上,比如同样为15W功耗,Kaby Lake核心的Core i7 7500U的频率为2.7GHz,睿频最高到3.5GHz;而现有的Core i7 6500U频率只有2.5GHz,睿频最高只有3.1GHz,差距还是比较明显的。在体现商用性能的Sysmark 2014评测软件中,7500U的性能比6500U高出12%左右;在Web性能的WebXPRT 2015的评测软件中,7500u的性能提升达19%。不过最大幅度的提升还是WinRAR压缩解压应用,7500U的优势扩大到28%,这主要得益于睿频时额外增加的400MHz频率提升。

2016110100040

Kaby Lake 核心的Core i7 7500U与上一代6500U的性能对比。

Kaby Lake的GPU部分

kaby Lake的GPU核心同样继承上一代产品,在Intel的体系中仍属于第九代架构,图形核心依然由EU单元构成,内部设计没有什么变动。根据处理器版本不同,Kaby Lake的GPU也分为GT2、GT4等多种配置,性能最高的GT4包括72个EU执行单元,GT2为24个执行单元,数量与第六代Core相同,不同的地方在于Intel提升了eDRAM 四级缓存的配置——比如最高性能版本可以集成256MB的eDRAM四级缓存,而现有第六代核心最高只能到128MB。

在没有明显改动EU单元内部设计、提高EU数量的情况下,指望Kaby Lake的图形性能有大幅度提升是不现实的,这对于用户来说多少会有些遗憾。但Intel的问题在于,如果AMD的Zen架构能够按期在2017年发布,那么Zen架构有望在处理器性能方面赶上Intel,而图形性能又是AMD的强项。所以对Intel来说,Kaby Lake一如既往的图形性能会有一些麻烦,至少用户对它们会很不感冒。

值得庆幸的是,Kaby Lake在视频性能方面获得大幅度的增强,Intel为它加入了增强的视频引擎,它包括MFX(Multi-Format Codex ,多媒体解码器)和VQE(Video Quality Engine ,视频质量引擎)两个部分。

MFX单元与VQE引擎

MFX是一个增强的解码器单元,它增加了10bit HEVC和8/10bit VP9格式的编码器和解码器。其中,HEVC是一套先进的视频格式标准,它可以让1080P视频内容的压缩效率提高50%左右。这项优势让它被认为是H.264、MPEG-4的最佳代替者,能够满足4K、8K视频时代的内容压缩要求。不过,HEVC也因此具备更高的算法复杂度,对硬件要求要比H.264高得多,之前Intel的核显只提供到8bit的HEVC硬加密能力,面对10bit HEVC内容时仍只能依靠CPU低效地完成。而在Kaby Lake架构中,新加入的MFX单元将让观看4K HEVC高清内容变得轻松自如。

VP9则是Google开发的视频格式,它是一套开放的压缩标准,可以提供比H.264更好的图像质量、同时码率却只有它的一半左右。这次Kaby Lake纳入了VP9的编解码功能,支持8bit的硬编码和8bit/10bit的解码,可以让Kaby Lake平台在在线视频应用中具有显著的性能提升。

除了这两项重要改进外,Kaby Lake的MFX单元还改善了无线显示时的画面质量,也提升了现行H.264/MPEG-4 AVC编解码的性能。

2016110100041

MFX、VQE的详细改进点

VQE引擎则在第四代Core架构时开始引入,现在它有了新功能:具有更宽的色域,并且在高动态范围和标准动态范围下都能获得应用。为了实现这一点,Intel对VQE引擎作了进一步改进,包括反交错、降低噪音、色彩增强、色彩校正等等。同时,新一代VQE还拥有更好的能效表现:在实现宽色域和HDR支持时,它只需要消耗40-50毫瓦的能源,让它在播放4K内容时,能够提供更好的画面观赏效果,同时不需担心设备发热会显著上升。

2016110100042

Kaby Lake获得增强的MFX/VQE媒体引擎。

实际性能增强

KabyLake的上述改进,让它得以胜任4K时代的现实需求。用数据能更直观地看出这一点。

KabyLake平台,可以支持最多8组4Kp/30(4K逐行、30帧速率)的超高清视频同时播放;或者是流畅地播放4Kp/60(4K逐行、60帧速率)的高质量视频,此时视频的流速达到120Mbps,这意味着Kaby Lake的媒体引擎要在一秒内完成120Mbit数据的实时解码,运算力相当强大。而它的能源效率也非常可观:功耗只有4.5W的Y系列处理器,就可以完成HEVC格式的4Kp/30视频的实时编码,也就是像Macbook这样的超轻薄小本,都可以很好完成这类繁重的视频创建任务。

那么对终端用户来说,换用新平台和沿用现行的第六代平台,又能带来多少实际的好处呢?首先一个最明显的好处就是降低了能耗。Intel采用《钢铁之泪(Tears of Steel)》的开源电影短片来展示两代平台的差异,视频基于10bit HEVC格式、4K清晰度,在现行的Core i7-6500U平台中,视频播放是依靠GPU和CPU一起混合解码的,此时CPU占用率要达到50%左右,而CPU/GPU的整体能耗达到10.2瓦。另一套Kaby Lake架构的对比平台则采用对应的Core i7-7500U处理器,由于它可以完全由CPU进行硬解码,CPU/GPU的功耗只有惊人的0.5瓦—这也意味着足足具有20倍的能源效率提升,而播放本地4K视频时的电池续航时间也因此可以提升2.6倍之多!

2016110100043

在4K HEVC 10bit内容解码时,Kaby Lake平台展现出强大的能耗优势。

如果应用的对象换为在线视频、结果会如何呢?对比的上述两个平台都用Chrome浏览器来播放Youtube上的4K VP9格式视频,其中 Core i7-6500U在CPU/GPU部分用了5.8瓦能源,而Core i7-7500U只用了0.8瓦,能耗降低了7倍!换算过来,在播放Youtube的4K视频时,KabyLake平台可以获得1.75倍的额外电池续航时间。目前基于Corei7-6500U的笔记本电脑,在播放这类4K视频时一般具有4小时左右的续航力,那么按此推算、Core i7-7500U平台就能达到7小时左右。不仅如此,Kaby Lake提供的性能冗余也让它为未来做好了准备,比如它可以胜任360度的4K内容、也就是沉浸式的4K VR应用,而当前的第六代Core平台无法满足这一点。

2016110100044

Kaby Lake与第六代Core架构在视频方面的功能对比。

Kaby Lake的产品线分布

与前次升级一样,KabyLake拥有一个完备的产品线,包括S系列、H系列、U系列和Y系列,跨越从高性能桌面、工作站到超轻薄笔记本的广阔市场,具体到产品型号上还是划分为i7、i5、i3三个不同等级。

2016110100045

面向主流市场的仍然会是i3、i5和i7三个系列。

针对桌面和工作站:S系列

S系列面向的是高性能市场,它包含许多不同的型号,主要以锁频与否、功耗和GPU配置作为区分。其中性能最高的是K开头的型号,它拥有四个处理器核心,搭载GT2级别的常规图形核心,最大的特点是不锁倍频、允许大家自由超频,功耗达91瓦。这个系列将在2017年初发布。

2016110100046

Kaby Lake S系列平台架构。

面向主流桌面的四核处理器则锁了倍频,功耗在35瓦到65瓦之间,它搭载了性能更高的GT4图形核心,内部集成了64MB的四级缓存,它的发布时间比不锁频的K系列稍迟一些。

而针对服务器和工作站的Xeon系列四核处理器,没有整合图形核心的有80瓦、54瓦和25瓦三种能耗配置,主要面向需要与GPU加速卡配合的高性能计算平台。而带GT2图形核心的有25-80瓦能耗配置,主要面向Web服务器、文件服务器、FTP服务器这类常规的商业云环境。

S系列的芯片平台采用“处理器+PCH”的组合方案。处理器部分,S系列支持双通道DDR3L-1600和DDR4-2400两种方案,OEM厂商可以自行决定要采用哪种内存。此外,它还包括一条PCI Express 3.0X16规格的图形总线、用于外接显卡,接口的带宽达到32GB/s。另外,它还支持三路数字显示接口输出,以及一个eDP嵌入式接口。

PCH方面,Kaby Lake可以兼容第六代Core的100系列芯片组,不过它配套的应该是改进后的200系列产品,除了USB 3.1支持、HDA高清音频、SATA硬盘总线外,200系列芯片将原本的20路PCIExpress 3.0总线提升到24路,总计提供48GB/s的双向带宽,可以支持Intel的Optane硬盘。它实际上是Intel的3D XPoint闪存技术的正式名称,介于传统内存、固态硬盘之间,可以提供极高的性能和极低的延迟。

针对高性能笔记本电脑:H系列

H系列是Kaby Lake的移动高性能版,它采用BGA1440封装、TDP功耗在35-45瓦范围内。H系列都拥有四个CPU核心,35瓦功耗版搭载标准版的GT2图形核心,面向主流高性能市场。不过,Intel还为顶级玩家准备了45瓦功耗的顶级型号,它将搭载GT4图形核心,并内建了128MB的eDRAML4高速缓存。不过它还不是最快的,Kaby Lake H家族还包含一款高达256MB L4缓存的顶级型号,没有例外的话,它也将成为Kaby Lake家族中图形性能最出色的处理器。

H系列同样采用处理器+PCH的解决方案,功能强大、但需要较大尺寸的主板才能容纳。

针对超极本:15/28瓦的U系列

U系列是Kaby Lake的移动低功耗版本,主要针对的是超极本市场。U系列采用BGA1356封装,功耗最低的版本TDP为15瓦,最高的型号是28瓦。U系列都包括两个CPU核心,图形部分有GT2、GT3两个版本,两者的区别主要是内建的eDRAM四级缓存——GT2版本并不包含、只能共享内存作为显存,而GT3内建了64MB的eDRAM,性能会更出色一些。

U系列有一个很重要的特点就是内建了SOC功能,也就是将PCH芯片与KabyLake CPU芯片集成在一起,这样就在一个处理器封装模块上同时实现包括CPU、图形核心、芯片组等所有的功能,主板的设计尺寸因此可以被大幅度缩小。可以见到,当前搭载第六代Core架构U系列处理器的超极本都可以做到惊人的轻薄尺度,原因也是处理器封装里包括PCH芯片。

2016110100047

kaby Lake U系列处理器,处理器和PCH芯片集成在一起。

2016110100048

Kaby Lake U系列的逻辑架构,采用双芯片、单模块的SOC集成设计。

内存支持方面。U系列也是双通道DDR3L和DDR4,不过它在I/O方面的功能久相对弱一些,比如只支持两路数字显示输出和一个嵌入式eDP显示接口,更遗憾的是只能支持到USB 3.0,未免有些落伍。此外,对于SSD它准备了SATA和PCIExpress两种接口,可以很好地满足现实需要。

针对平板电脑:4.5瓦的Y系列

Y系列其实就是之前的Core M产品,面向的是平板电脑以及追求极致轻薄的超便携机型。Y系列采用BGA1515封装,它的主要诉求是低至4.5瓦的超低功耗水平,这让它可以保持无风扇运行。Y系列都整合了GT2图形核心、不带eDRAM高速缓存。由于Y系列面向尺寸更小的计算市场,处理器封装也采用SOC设计、同样集成了PCH芯片。I/O功能与U系列完全相同,它也没法原生支持USB 3.1。

2016110100049

同样双芯片、更为紧凑的Y系列。

2016110100050

需要换Kaby Lake平台么?

如果你已经在用六代平台或者四五代平台,纯粹因为性能的关系升级到七代平台,我们认为你或多或少会觉得失望,Kaby Lake平台的性能固然得到提升,视频方面的能力也非常强大,但它更多是一种渐进式的改进。

Intel也深知这一点,它采用五年前的PC平台作为参照物加以说明。对比五年前的平台,Kaby Lake在商务应用中可以获得1.7倍的性能提升;此外,Kaby Lake可以很好地胜任4K视频创次建和播放的需要。通俗一点说,我们认为五年前的PC也能够完成大多数日常任务,但如果升级到Kaby lake平台,大家可以直观地感受到运行速度更快、CPU占用率更低、平台的发热量更小、风扇更加安静。假如你要在电脑中运行多个虚拟机,那么就会恨不得榨取每一分的性能,Kaby Lake平台在这些方面就有明显优势。从这些人性化体验的角度来看,我们认为升级到新一代平台还是有着明显的好处。

2016110100051

AMD ZEN处理器的各种“泄漏”,相信也给了Intel一定的压力和动力。

只不过,Intel还需要面对的一个潜在问题,就是AMD的Zen架构能具有什么样的表现,假如Zen在处理器性能和效率上赶上Intel的步伐,那么Intel将重新经历久违的市场竞争——毕竟AMD在图形领域具有不对称的优势,它所欠缺的其实就是一个强有力的CPU平台。我相信消费者乐见于此,没有竞争,市场只会一潭死水、厂商缺乏前进的动力,我们也无法看到IT技术所应有的高速演进。

(本文来源:微型计算机)

20160630000123