论文部分内容阅读
AES性能
AES逐步成为最为主流加密/解密运算,为其添加专用指令集,对性能改善的作用非常明显。在Sandy Bridge,这种改善超过一个数量级!在过去只有专用加速芯片才能实现如此之提高,而今天,这是新平台内置的功能。
压缩性能
Sandy Bridge处理器的文件压缩/解压缩性能有了接近8倍的提升(PassMark PerformanceTest v7.0文件压缩测试)。可以想象,使用此平台后,将为我们的生活带来多大改变。
整数性能
相对于其他方面的改进,Sandy Bridge针对整数运算所作出的改进显得不多,但增加微指令缓存、引入物理寄存器文件等架构上的多处改进依带来25.6%的提升(使用Sisoftware Sandra 2011多媒体测试的整数运算性能)。
多线程压缩
即便是最为常用的WinRAR解压缩操作,新平台仍能带来倍增的性能表现。换言之,Sandy Bridge不仅可以令未来的应用充满活力,也能让现在的生活得以改善。
AIDA64 Benchmark-CPU AES
Core i7-875K成绩为36801
PassMark PerformanceTest压缩性能
Core i7-875K成绩为1255.8KB Processed/s
WinRAR多线程压缩测试
Core i7-875K成绩为3118KB/s
Sandra多媒体整数性能
Core i7-875K成绩为160MPixel/s
AVX对性能的影响
在AVX应用还不够完善时,我们就可看到它对平台性能的影响。以Core i7-875K为基准,Core i7-2600K性能提升浮度达26%,而不开启AVX的情况下,性能只提升11%。
与Nehalem及其衍生的Westmere架构相仿,Sandy Bridge也将处理器产品以高低端划分,并通过处理器接口加以区分。即将发布的Core i7/5/3产品均将采用LGA1155接口,仅支持双通道内存,更高端的版本将有可能在2011年第三季度正式推出,仍旧采用32nm工艺,但接口升级为LGA2011,并史无前例地支持4通道内存以提供更高的I/O吞吐能力。
相比以往,本次Sandy Bridge发布的产品可谓声势浩大,仅桌面版产品就有18款之多。在命名规则上,新产品延续了目前已经在消费者中拥有良好口碑的Core i7/5/3以及入门级的Pentium,其中Core i系列中采用了4位数字产品标识,以区别以往产品。此外,在桌面版的Sandy Bridge中,英特尔还引入了更多的尾字母以标识产品划分。除去早已有的K代表未锁倍频版之外,还新出现了S、T,它们分别代表4核心节能版和超低功耗版(详细参数请参阅处理器完整规格表)。
而与首批面试的Sandy Bridge相配合的将是全新推出的英特尔6系列芯片组,代号Cougar Point,目前已确知的商品型号包括P67、H67、H61等。其中P67定位主流及高端市场,提供14组USB 2.0接口、6组SATA 接口(其中两组为SATA 6G/s)。H67是在P67的基础上提供了对显示输出接口的支持,H61则相对在接口规格上有所删减。
AVX向量指令扩展
AVX是Sandy Bridge最被人们关注的变化之一。其全称是Advanced Vector Extensions,即“高级矢量扩展”指令集。Sandy Bridge成为首款支持该指令集的处理器产品,英特尔甚至宣称其重要性堪比1999年的Pentium III处理器引入SSE指令集。
矢量,在数学上表现为多个标量的合集。 AVX为了更好地容纳多个标量,将浮点指令扩展到了256bit YMM,从而为单指令多数据流(SIMD)运算提供更多的空间。同时,AVX支持在单一指令中引入3个和4个操作数,降低了寄存器的拷贝次数,进一步提升执行效率。最终的结果就是Sandy Bridge处理器在高密集浮点运算环境(例如多媒体处理、3D建模、数据库和科学计算仿真等)下的性能得到了明显增强。
AVX虽然如此优秀,但对于应用程序来说,256bit的AVX指令集需要它们重新编译才能充分利用。因此,AVX指令集还可兼容传统的MMX/SSE指令,使得指令集的过渡不致过于突兀。同时,Sandy Bridge中允许在256bit的数据通道中同时载入2组128bit指令,从而获得2倍的理论浮点吞吐能力。
目前已知仅有即将发布的Windows 7 SP1/ Windows Server 2008 R2 SP1操作系统才能提供对AVX的支持,CHIP也在本次测试中引入了Windows 7 SP1系统以测试AVX对Sandy Bridge处理器实际应用性能的影响。Sisoftware Sandra 2011的Cryptography项目中的SHA256 Hashing测试明确提供了对AVX指令集的支持。通过测试发现,在Windows 7环境下,Core i7-2600K的成绩相比上一代相同定位的产品Core i7-875K,优势约为11.2%。而在Windows SP1环境下启用AVX之后,Core i7-2600K的优势迅速扩大至25.7%。
整数运算性能跃升
尽管相比AVX指令集的引入,Sandy Bridge针对整数运算所作出的调整相对有限,但增加微指令缓存、引入物理寄存器文件等架构上的多处改进依然令其性能展现出了惊人的进步。在Sisoftware Sandra 2011的多媒体测试中,Core i7-2600K的整数运算性能高达201.0MPixel/s,相比Core i7 875K提升约25.6%。
得益于此,Sandy Bridge处理器的文件压缩/解压缩性能有了明显增强。在PassMark PerformanceTest v7.0测试中,Core i7-2600K的文件压缩性能达到了惊人的11199.4KB Processed/s,相比之下,Core i7-875K的1255.8KB Processed/s成绩显得“难以启齿”。尽管测试经验总是在教育我们实际应用与理论性能会有着比较大的差异,但在WinRAR测试中我们依然感受到了Core i7-2600K的强悍性能。多线程下其压缩性能达到了6217KB/s,将Core i7-875K远远甩在后面。
Westmere处理器中引入的AES-NI加密/解密运算指令在Sandy Bridge处理器上得到了发扬光大。在多项测试中均体现出了超乎想象的进步。在AIDA64 Benchmark的CPU AES项目中,Core i7-2600K的测试成绩为477788,这一成绩甚至高出目前所有桌面系统1个数量级。我们经过多次反复的测试才最终确认这一成绩并非是硬件或软件本身的BUG,而是真实有效的。同样的情况在PCMark Vantage和Sisoftware Sandra 2011的数据加密/解解密测试中也依然存在。这种性能的跨越式进步,无疑将为Sandy Bridge带来极为光明的商业应用市场前景。
追赶入门级独立显示卡
整合显示核心是Sandy Bridge的另一大改进。与Westmere处理器所使用的MXM技术不同,Sandy Bridge将显示模块完全集成于芯片内部,并允许其与处理器模块共享三级缓存,以提升整体性能。
新的集成显示核心仍然沿用了以往的整体架构,但在规格上做出了明显的增强。与上一代的GMA HD相比,全新的HD Graphic显示核心每个线程的寄存器数量提升了50%,达到了120个,因此其单个Execution Units(执行单元)的吞吐量增加了约1倍。
与以往英特尔集成显示核心仅存在频率差异不同,Sandy Bridge中GPU模块针对不同的市场定位,在Execution Units数量上也有所区分。其中桌面版的Core i7-2600K/2600/2500K/2500配备了完整的GPU,即配备有12个EU、商品型号为“HD Graphic 3000”的图形核心。而在其他产品的GPU中仅有6个EU,商品型号为“HD Graphic 2000”。Sandy Bridge还将Turbo Boost功能升级为2.0,其中最重要的变化之一即是支持GPU部分进行自动超频,即当系统对图形性能更为渴求时,处理器会根据CPU模块本身的负载情况,适当地释放出部分TDP资源,为运行频率提升的GPU获得足够的散热能力。同样根据产品定位,Turbo Boost的幅度也有所不同。
经历过多项改进和补强的HD Graphic 3000,在3DMark 06的SM2.0和HDR/SM3.0项目中分别得到了1414分和1679分,这一成绩已经足以同入门级独立显示卡分庭抗礼。实际游戏测试中,HD Graphic 3000同样表现出色,在1024×768分辨率下,其《街头霸王 IV》的平均帧速可达51fps。在《HAWX》的DirectX 10.1模式下,也能够获得约40fps的游戏性能。相信随着驱动的进一步成熟,未来HD Graphic 3000的性能还有进一步提升的可能,甚至将成为入门级独立显示卡的“掘墓人”。
测试中的小遗憾
由于能发挥AVX、AES等新特性的测试和应用尚不丰富,因此Sandy Bridge的性能并未能在本次测试中得到最完全的展现。例如其新引入的“多媒体视频转码单元”将能够在视频转换等应用中带来飞跃式的性能进步,但由于目前尚未有公开的支持该功能的视频编解码软件,因此其实力究竟如何只能等待未来的测试进行验证。
另外,尽管Sandy Bridge已经将时钟频率发生器整合进处理器芯片内部,因此用户无法像以前那样通过调节处理器外频而获得性能的进一步提升,但带有“K”字后缀的倍频解锁版据称拥有风冷条件下轻松超过5GHz的潜力,且相应的P67芯片组也拥有极佳的内存超频能力。但由于时间紧迫,我们尚未及对其进行测试验证,相应的测试将在下期杂志中刊登。
测试总结:尽管AVX、多媒体视频转码单元等多项重要改进尚未能得到全面的应用,但Sandy Bridge处理器在传统测试项目中表现出来的性能提升依然令人震撼。以数据加密、文件压缩以及多媒体处理为代表的多项性能均有了大幅度增强,且在实际应用中依然能够展现出相应的优势。以往备受诟病的集成显示核心性能在Sandy Bridge处理器中也得到了翻天覆地的改变,堪比入门级独立显示卡的游戏性能,必将会给整个图形市场带来强烈的冲击。相信随着Sandy Bridge处理器的正式发布,新一轮的升级大潮将会如期而至。
“空虚”的6系列主板
随着处理器吸入了越来越多北桥的功能,如今与Sandy Bridge配套的6系列芯片组(P67、H67、H61)缩减为单颗芯片,从此不再成“组”。
由于芯片组本身可发挥余地很小,同时Sandy Bridge内置时钟发生器,超频也难以成为此系列主板的差异点,对主板厂商来说,相对更有机会发挥自身设计和开发技术实力。随同英特尔发布,各家主板厂商都推出了大量规格迥异的主板,以期在市场覆盖面上获取优势地位。据CHIP所知,像技嘉这样的主板大厂,一口气推出了不同芯片组、不同板型以及不同功能档次的6系列主板,总数量超过10款,这种情况以往并不多见。
AES逐步成为最为主流加密/解密运算,为其添加专用指令集,对性能改善的作用非常明显。在Sandy Bridge,这种改善超过一个数量级!在过去只有专用加速芯片才能实现如此之提高,而今天,这是新平台内置的功能。
压缩性能
Sandy Bridge处理器的文件压缩/解压缩性能有了接近8倍的提升(PassMark PerformanceTest v7.0文件压缩测试)。可以想象,使用此平台后,将为我们的生活带来多大改变。
整数性能
相对于其他方面的改进,Sandy Bridge针对整数运算所作出的改进显得不多,但增加微指令缓存、引入物理寄存器文件等架构上的多处改进依带来25.6%的提升(使用Sisoftware Sandra 2011多媒体测试的整数运算性能)。
多线程压缩
即便是最为常用的WinRAR解压缩操作,新平台仍能带来倍增的性能表现。换言之,Sandy Bridge不仅可以令未来的应用充满活力,也能让现在的生活得以改善。
AIDA64 Benchmark-CPU AES
Core i7-875K成绩为36801
PassMark PerformanceTest压缩性能
Core i7-875K成绩为1255.8KB Processed/s
WinRAR多线程压缩测试
Core i7-875K成绩为3118KB/s
Sandra多媒体整数性能
Core i7-875K成绩为160MPixel/s
AVX对性能的影响
在AVX应用还不够完善时,我们就可看到它对平台性能的影响。以Core i7-875K为基准,Core i7-2600K性能提升浮度达26%,而不开启AVX的情况下,性能只提升11%。
与Nehalem及其衍生的Westmere架构相仿,Sandy Bridge也将处理器产品以高低端划分,并通过处理器接口加以区分。即将发布的Core i7/5/3产品均将采用LGA1155接口,仅支持双通道内存,更高端的版本将有可能在2011年第三季度正式推出,仍旧采用32nm工艺,但接口升级为LGA2011,并史无前例地支持4通道内存以提供更高的I/O吞吐能力。
相比以往,本次Sandy Bridge发布的产品可谓声势浩大,仅桌面版产品就有18款之多。在命名规则上,新产品延续了目前已经在消费者中拥有良好口碑的Core i7/5/3以及入门级的Pentium,其中Core i系列中采用了4位数字产品标识,以区别以往产品。此外,在桌面版的Sandy Bridge中,英特尔还引入了更多的尾字母以标识产品划分。除去早已有的K代表未锁倍频版之外,还新出现了S、T,它们分别代表4核心节能版和超低功耗版(详细参数请参阅处理器完整规格表)。
而与首批面试的Sandy Bridge相配合的将是全新推出的英特尔6系列芯片组,代号Cougar Point,目前已确知的商品型号包括P67、H67、H61等。其中P67定位主流及高端市场,提供14组USB 2.0接口、6组SATA 接口(其中两组为SATA 6G/s)。H67是在P67的基础上提供了对显示输出接口的支持,H61则相对在接口规格上有所删减。
AVX向量指令扩展
AVX是Sandy Bridge最被人们关注的变化之一。其全称是Advanced Vector Extensions,即“高级矢量扩展”指令集。Sandy Bridge成为首款支持该指令集的处理器产品,英特尔甚至宣称其重要性堪比1999年的Pentium III处理器引入SSE指令集。
矢量,在数学上表现为多个标量的合集。 AVX为了更好地容纳多个标量,将浮点指令扩展到了256bit YMM,从而为单指令多数据流(SIMD)运算提供更多的空间。同时,AVX支持在单一指令中引入3个和4个操作数,降低了寄存器的拷贝次数,进一步提升执行效率。最终的结果就是Sandy Bridge处理器在高密集浮点运算环境(例如多媒体处理、3D建模、数据库和科学计算仿真等)下的性能得到了明显增强。
AVX虽然如此优秀,但对于应用程序来说,256bit的AVX指令集需要它们重新编译才能充分利用。因此,AVX指令集还可兼容传统的MMX/SSE指令,使得指令集的过渡不致过于突兀。同时,Sandy Bridge中允许在256bit的数据通道中同时载入2组128bit指令,从而获得2倍的理论浮点吞吐能力。
目前已知仅有即将发布的Windows 7 SP1/ Windows Server 2008 R2 SP1操作系统才能提供对AVX的支持,CHIP也在本次测试中引入了Windows 7 SP1系统以测试AVX对Sandy Bridge处理器实际应用性能的影响。Sisoftware Sandra 2011的Cryptography项目中的SHA256 Hashing测试明确提供了对AVX指令集的支持。通过测试发现,在Windows 7环境下,Core i7-2600K的成绩相比上一代相同定位的产品Core i7-875K,优势约为11.2%。而在Windows SP1环境下启用AVX之后,Core i7-2600K的优势迅速扩大至25.7%。
整数运算性能跃升
尽管相比AVX指令集的引入,Sandy Bridge针对整数运算所作出的调整相对有限,但增加微指令缓存、引入物理寄存器文件等架构上的多处改进依然令其性能展现出了惊人的进步。在Sisoftware Sandra 2011的多媒体测试中,Core i7-2600K的整数运算性能高达201.0MPixel/s,相比Core i7 875K提升约25.6%。
得益于此,Sandy Bridge处理器的文件压缩/解压缩性能有了明显增强。在PassMark PerformanceTest v7.0测试中,Core i7-2600K的文件压缩性能达到了惊人的11199.4KB Processed/s,相比之下,Core i7-875K的1255.8KB Processed/s成绩显得“难以启齿”。尽管测试经验总是在教育我们实际应用与理论性能会有着比较大的差异,但在WinRAR测试中我们依然感受到了Core i7-2600K的强悍性能。多线程下其压缩性能达到了6217KB/s,将Core i7-875K远远甩在后面。
Westmere处理器中引入的AES-NI加密/解密运算指令在Sandy Bridge处理器上得到了发扬光大。在多项测试中均体现出了超乎想象的进步。在AIDA64 Benchmark的CPU AES项目中,Core i7-2600K的测试成绩为477788,这一成绩甚至高出目前所有桌面系统1个数量级。我们经过多次反复的测试才最终确认这一成绩并非是硬件或软件本身的BUG,而是真实有效的。同样的情况在PCMark Vantage和Sisoftware Sandra 2011的数据加密/解解密测试中也依然存在。这种性能的跨越式进步,无疑将为Sandy Bridge带来极为光明的商业应用市场前景。
追赶入门级独立显示卡
整合显示核心是Sandy Bridge的另一大改进。与Westmere处理器所使用的MXM技术不同,Sandy Bridge将显示模块完全集成于芯片内部,并允许其与处理器模块共享三级缓存,以提升整体性能。
新的集成显示核心仍然沿用了以往的整体架构,但在规格上做出了明显的增强。与上一代的GMA HD相比,全新的HD Graphic显示核心每个线程的寄存器数量提升了50%,达到了120个,因此其单个Execution Units(执行单元)的吞吐量增加了约1倍。
与以往英特尔集成显示核心仅存在频率差异不同,Sandy Bridge中GPU模块针对不同的市场定位,在Execution Units数量上也有所区分。其中桌面版的Core i7-2600K/2600/2500K/2500配备了完整的GPU,即配备有12个EU、商品型号为“HD Graphic 3000”的图形核心。而在其他产品的GPU中仅有6个EU,商品型号为“HD Graphic 2000”。Sandy Bridge还将Turbo Boost功能升级为2.0,其中最重要的变化之一即是支持GPU部分进行自动超频,即当系统对图形性能更为渴求时,处理器会根据CPU模块本身的负载情况,适当地释放出部分TDP资源,为运行频率提升的GPU获得足够的散热能力。同样根据产品定位,Turbo Boost的幅度也有所不同。
经历过多项改进和补强的HD Graphic 3000,在3DMark 06的SM2.0和HDR/SM3.0项目中分别得到了1414分和1679分,这一成绩已经足以同入门级独立显示卡分庭抗礼。实际游戏测试中,HD Graphic 3000同样表现出色,在1024×768分辨率下,其《街头霸王 IV》的平均帧速可达51fps。在《HAWX》的DirectX 10.1模式下,也能够获得约40fps的游戏性能。相信随着驱动的进一步成熟,未来HD Graphic 3000的性能还有进一步提升的可能,甚至将成为入门级独立显示卡的“掘墓人”。
测试中的小遗憾
由于能发挥AVX、AES等新特性的测试和应用尚不丰富,因此Sandy Bridge的性能并未能在本次测试中得到最完全的展现。例如其新引入的“多媒体视频转码单元”将能够在视频转换等应用中带来飞跃式的性能进步,但由于目前尚未有公开的支持该功能的视频编解码软件,因此其实力究竟如何只能等待未来的测试进行验证。
另外,尽管Sandy Bridge已经将时钟频率发生器整合进处理器芯片内部,因此用户无法像以前那样通过调节处理器外频而获得性能的进一步提升,但带有“K”字后缀的倍频解锁版据称拥有风冷条件下轻松超过5GHz的潜力,且相应的P67芯片组也拥有极佳的内存超频能力。但由于时间紧迫,我们尚未及对其进行测试验证,相应的测试将在下期杂志中刊登。
测试总结:尽管AVX、多媒体视频转码单元等多项重要改进尚未能得到全面的应用,但Sandy Bridge处理器在传统测试项目中表现出来的性能提升依然令人震撼。以数据加密、文件压缩以及多媒体处理为代表的多项性能均有了大幅度增强,且在实际应用中依然能够展现出相应的优势。以往备受诟病的集成显示核心性能在Sandy Bridge处理器中也得到了翻天覆地的改变,堪比入门级独立显示卡的游戏性能,必将会给整个图形市场带来强烈的冲击。相信随着Sandy Bridge处理器的正式发布,新一轮的升级大潮将会如期而至。
“空虚”的6系列主板
随着处理器吸入了越来越多北桥的功能,如今与Sandy Bridge配套的6系列芯片组(P67、H67、H61)缩减为单颗芯片,从此不再成“组”。
由于芯片组本身可发挥余地很小,同时Sandy Bridge内置时钟发生器,超频也难以成为此系列主板的差异点,对主板厂商来说,相对更有机会发挥自身设计和开发技术实力。随同英特尔发布,各家主板厂商都推出了大量规格迥异的主板,以期在市场覆盖面上获取优势地位。据CHIP所知,像技嘉这样的主板大厂,一口气推出了不同芯片组、不同板型以及不同功能档次的6系列主板,总数量超过10款,这种情况以往并不多见。