论文部分内容阅读
仰仗经验,对产品优劣进行判断的用户往往对不断推陈出新的产品形态和应用后知后觉,以表面规格判断形势,但这些简单的参数对比并不能体现出产品的最终价值。CHIP在面对APU以及SoC变化时对平台性能测试方案调整持谨慎的态度,因为仅凭现有经验,仓促地给出一款新目标定位的产品“好”或“差”的评价太过草率。
新前景
当x86面临ARM强力挑战之时,x86内部的两大厂商AMD和英特尔的竞争也仍未停止。虽然在很长的一段时间里,英特尔凭借有节奏地推出新产品和领先的制程工艺,压得AMD喘不过气来。但是坚持了数年之后,AMD坚持投入的全新APU概念,逐步从去年第一代的花开花落,走向第二代Trinity产品的瓜熟蒂落,不仅让融合的概念从简单的CPU+GPU走向成熟的统一加速,还解决了困扰PC架构30余年的Process(处理器)和Coprocessor(协处理器)协同工作、合并计算的问题,这就是前景更加诱人的异构计算架构(Heterogeneous Computing Architecture,HCA)。
由于指令集及软件编译架构的限制,初期的x86系统支持多个不同类型处理单元的机制并不完善,只能依赖CPU在进程执行前,一次性分配任务和资源给不同的协处理器,以实现协同工作。这就意味着CPU的分配机制要非常完善,即便如此,也难以避免将某些特殊计算任务分配给不擅长于此的协处理器。理论上,CPU在ALU(数逻运算单元)的基础上,陆续增加FPU(浮点处理单元)、GPU(图形处理单元)和APU(音频处理单元)等组件后,它们在CPU的分配下,能各自进行着最擅长的工作。但是随着计算复杂度的加深,多个协处理器之间的工作协调与再分配以及多个同功能协处理器的任务平衡的矛盾逐步显露,于是就出现了“计算时CPU累死、GPU闲着”以及“游戏时GPU累死、CPU闲着”的现象。
借助HCA,新一代APU内的各个处理器特性对等,相互之间可以自我协商并协调工作;同时,各处理器在执行任务时也非常容易相互交付,这种交付是动态实时的,从而可以让进程的每个环节跑在不同的最佳处理器上,实现最优的整体表现。
生态系统建立
在优化硬件结构设计的同时,AMD痛下决心提高软件水平。软件的优化,对提高硬件表现的作用至关重要,甚至超过硬件架构升级本身。在一直采用英特尔编译器而被掣肘多年后,AMD借助HCA和OpenCL的开放性,终于完善了针对APU特性的编译器,并且将老对手拖入了由其力推的OpenCL发展路线中。
特别是随着Trinity推出,APU实现了直接C++编译,这样程序员不用再重新学习高难度的OpenCL编程方式,转而采用他们再熟悉不过的C++代码。支持C++可谓是APU的一大提升,不仅是在Windows下,在Linux、iOS/Mac OS亦或是Android中,主要的编程语言都是C++。C++编译器的存在,意味着无穷无尽的应用,可以极为便利地被重新编译为APU的优化版本,而且是跨平台的,便于移植。
因此,在Trinity发布伊始,就有包括Adobe CS6在内的100多款重头软件宣布支持它也就不难理解了。随着软件生态系统的建立,APU的生存环境逐渐走向良性发展。
广泛布局
在成功推出Trinity之前,AMD一直对其进入平板电脑市场以及推出ARM架构产品三缄其口。直至4月,在美国奥斯汀的Trinity Reviewers Day上,CEO罗瑞德(Rory Read)才正式透露了AMD已正式涉足以上两个领域,其中Trinity集成了基于ARM的安全协处理单元,而基于APU架构的平板产品也初露端倪。
即便是在传统的PC领域,Trinity的覆盖范围也较前代产品Llano增加了很多,最具代表性的例子莫过于主流性能的A系列产品推出mBGA(小型球栅)封装的最低17W TDP的低功耗版本,从物理厚度到功耗,两个维度的下降抢占了颇具商机的超薄笔记本电脑市场,即Ultrathin产品类别。
考虑到移动市场产品更新的迫切性,AMD首先推出了新款移动版APU,包括了旗舰级的A系列和入门级的E系列。其中首发包括A10-4600M、A8-4500M和A6-4400M等3款标准功耗产品,而低功耗的A10-4655M和A6-4455M面向更轻薄的产品并保持主流性能。值得一提的是,A10-4655M的TDP仅为25W,它是唯一一款面向超薄笔记本电脑的四核处理器,内置的图形核心级别也较高,这令超薄笔记本电脑在轻薄的同时能保持性能竞争能力。
在Trinity APU之后,AMD将于10月前后推出代号为Vishera的APU/CPU,归属FX系列,主打高性能领域。其中FX-6300、FX-4320 TDP约为95W,而顶级的八核FX-8350采用了16MB的缓存,频率高达4.0GHz,TDP为125W左右。
再接再厉
“集显”、“独显”和“双显”是APU带来的超灵活图形显示解决方案,其命名方式在前代APU上就已令人头晕脑胀,而新的Trinity并未做出改变,继续延续了这一特征。
在最顶级的A10-4600M平台测试中,编号为Radeon HD 7660G的集成图形核心表现十分彪悍。单从编号上来看,“7600”级别的GPU已经高过很多直接配备独立显示卡的笔记本电脑,而与“7600”级别的独立显示卡“交火”后,其编号更升至“7700”级别,俨然称为高图形性能的产品,实际测试表现也印证了这一点。
AMD在GPU领域中的成功有目共睹,而放入APU中的GPU型号更是拥有绝佳性价比的产品。Trinity的图形部分并未经过大幅革新,而是像独立显示卡HD 7000升级至HD 6000一样,仅仅在制程和个别规格上略有提升,Trinity着重提升的是处理单元的性能。即便如此,一年前的Llano A8-3500M中的
HD 6620G也足够与英特尔最新的Ivy Bridge集成的HD 4000打个平手,而经过简单升级的HD 7660G,更可在主流3D应用中再提升30%~200%,性能直指中档独立显示卡。这样的表现完全可以让用户打消对APU图形能力的顾虑,而且在使用集成核心与独立显示核心混合交火的方案后,整体图形性能还会有更大幅度的提升。考虑到目前3D应用的片面性,未来APU的HCA优势若得以发挥,更是前途广阔,而且越小的设备这一现象越为明显,这足以成为英特尔SoC的劲敌。
除了依旧的出色图形性能,Trinity着力提升的计算性能方面也硕果累累。同为顶级,同为四核,A10-4600M与Core i7-3720QM互有胜负,随着测试负载的提高,两者的差距逐渐缩小。而其功耗水平上的表现,更是令人兴奋:在空闲模式下,A10平台待机功耗仅为Core i7的一半,高CPU负载时为竞品的80%,由此所反映出的是待机时间近1小时的差距。
针锋相对
有了好的硬件架构和软件的优化,我们对Trinity性能的疑虑已经打消,那么在日渐流行的轻薄产品领域,该产品表现又如何呢?
在Ultrabook产品上,为了提高用户体验,英特尔加入了快速启动、超长待机等特性,AMD也推出了类似的技术,并推广到整个APU产品线,其中包括应用多年的AllDay全天运行、Start Now(快启)、Turbo Core自动超频等技术。
针锋相对的技术,加上针锋相对的市场,Trinity所要迎接的挑战也是巨大的。考虑到错位竞争的需求,即便是最高端的A10也没有瞄准Core i7这样的旗舰产品,而是直接面向Core i5的市场,以图形的优势、四核的规格、OpenCL的全面支持挑战市场的主流产品。
新前景
当x86面临ARM强力挑战之时,x86内部的两大厂商AMD和英特尔的竞争也仍未停止。虽然在很长的一段时间里,英特尔凭借有节奏地推出新产品和领先的制程工艺,压得AMD喘不过气来。但是坚持了数年之后,AMD坚持投入的全新APU概念,逐步从去年第一代的花开花落,走向第二代Trinity产品的瓜熟蒂落,不仅让融合的概念从简单的CPU+GPU走向成熟的统一加速,还解决了困扰PC架构30余年的Process(处理器)和Coprocessor(协处理器)协同工作、合并计算的问题,这就是前景更加诱人的异构计算架构(Heterogeneous Computing Architecture,HCA)。
由于指令集及软件编译架构的限制,初期的x86系统支持多个不同类型处理单元的机制并不完善,只能依赖CPU在进程执行前,一次性分配任务和资源给不同的协处理器,以实现协同工作。这就意味着CPU的分配机制要非常完善,即便如此,也难以避免将某些特殊计算任务分配给不擅长于此的协处理器。理论上,CPU在ALU(数逻运算单元)的基础上,陆续增加FPU(浮点处理单元)、GPU(图形处理单元)和APU(音频处理单元)等组件后,它们在CPU的分配下,能各自进行着最擅长的工作。但是随着计算复杂度的加深,多个协处理器之间的工作协调与再分配以及多个同功能协处理器的任务平衡的矛盾逐步显露,于是就出现了“计算时CPU累死、GPU闲着”以及“游戏时GPU累死、CPU闲着”的现象。
借助HCA,新一代APU内的各个处理器特性对等,相互之间可以自我协商并协调工作;同时,各处理器在执行任务时也非常容易相互交付,这种交付是动态实时的,从而可以让进程的每个环节跑在不同的最佳处理器上,实现最优的整体表现。
生态系统建立
在优化硬件结构设计的同时,AMD痛下决心提高软件水平。软件的优化,对提高硬件表现的作用至关重要,甚至超过硬件架构升级本身。在一直采用英特尔编译器而被掣肘多年后,AMD借助HCA和OpenCL的开放性,终于完善了针对APU特性的编译器,并且将老对手拖入了由其力推的OpenCL发展路线中。
特别是随着Trinity推出,APU实现了直接C++编译,这样程序员不用再重新学习高难度的OpenCL编程方式,转而采用他们再熟悉不过的C++代码。支持C++可谓是APU的一大提升,不仅是在Windows下,在Linux、iOS/Mac OS亦或是Android中,主要的编程语言都是C++。C++编译器的存在,意味着无穷无尽的应用,可以极为便利地被重新编译为APU的优化版本,而且是跨平台的,便于移植。
因此,在Trinity发布伊始,就有包括Adobe CS6在内的100多款重头软件宣布支持它也就不难理解了。随着软件生态系统的建立,APU的生存环境逐渐走向良性发展。
广泛布局
在成功推出Trinity之前,AMD一直对其进入平板电脑市场以及推出ARM架构产品三缄其口。直至4月,在美国奥斯汀的Trinity Reviewers Day上,CEO罗瑞德(Rory Read)才正式透露了AMD已正式涉足以上两个领域,其中Trinity集成了基于ARM的安全协处理单元,而基于APU架构的平板产品也初露端倪。
即便是在传统的PC领域,Trinity的覆盖范围也较前代产品Llano增加了很多,最具代表性的例子莫过于主流性能的A系列产品推出mBGA(小型球栅)封装的最低17W TDP的低功耗版本,从物理厚度到功耗,两个维度的下降抢占了颇具商机的超薄笔记本电脑市场,即Ultrathin产品类别。
考虑到移动市场产品更新的迫切性,AMD首先推出了新款移动版APU,包括了旗舰级的A系列和入门级的E系列。其中首发包括A10-4600M、A8-4500M和A6-4400M等3款标准功耗产品,而低功耗的A10-4655M和A6-4455M面向更轻薄的产品并保持主流性能。值得一提的是,A10-4655M的TDP仅为25W,它是唯一一款面向超薄笔记本电脑的四核处理器,内置的图形核心级别也较高,这令超薄笔记本电脑在轻薄的同时能保持性能竞争能力。
在Trinity APU之后,AMD将于10月前后推出代号为Vishera的APU/CPU,归属FX系列,主打高性能领域。其中FX-6300、FX-4320 TDP约为95W,而顶级的八核FX-8350采用了16MB的缓存,频率高达4.0GHz,TDP为125W左右。
再接再厉
“集显”、“独显”和“双显”是APU带来的超灵活图形显示解决方案,其命名方式在前代APU上就已令人头晕脑胀,而新的Trinity并未做出改变,继续延续了这一特征。
在最顶级的A10-4600M平台测试中,编号为Radeon HD 7660G的集成图形核心表现十分彪悍。单从编号上来看,“7600”级别的GPU已经高过很多直接配备独立显示卡的笔记本电脑,而与“7600”级别的独立显示卡“交火”后,其编号更升至“7700”级别,俨然称为高图形性能的产品,实际测试表现也印证了这一点。
AMD在GPU领域中的成功有目共睹,而放入APU中的GPU型号更是拥有绝佳性价比的产品。Trinity的图形部分并未经过大幅革新,而是像独立显示卡HD 7000升级至HD 6000一样,仅仅在制程和个别规格上略有提升,Trinity着重提升的是处理单元的性能。即便如此,一年前的Llano A8-3500M中的
HD 6620G也足够与英特尔最新的Ivy Bridge集成的HD 4000打个平手,而经过简单升级的HD 7660G,更可在主流3D应用中再提升30%~200%,性能直指中档独立显示卡。这样的表现完全可以让用户打消对APU图形能力的顾虑,而且在使用集成核心与独立显示核心混合交火的方案后,整体图形性能还会有更大幅度的提升。考虑到目前3D应用的片面性,未来APU的HCA优势若得以发挥,更是前途广阔,而且越小的设备这一现象越为明显,这足以成为英特尔SoC的劲敌。
除了依旧的出色图形性能,Trinity着力提升的计算性能方面也硕果累累。同为顶级,同为四核,A10-4600M与Core i7-3720QM互有胜负,随着测试负载的提高,两者的差距逐渐缩小。而其功耗水平上的表现,更是令人兴奋:在空闲模式下,A10平台待机功耗仅为Core i7的一半,高CPU负载时为竞品的80%,由此所反映出的是待机时间近1小时的差距。
针锋相对
有了好的硬件架构和软件的优化,我们对Trinity性能的疑虑已经打消,那么在日渐流行的轻薄产品领域,该产品表现又如何呢?
在Ultrabook产品上,为了提高用户体验,英特尔加入了快速启动、超长待机等特性,AMD也推出了类似的技术,并推广到整个APU产品线,其中包括应用多年的AllDay全天运行、Start Now(快启)、Turbo Core自动超频等技术。
针锋相对的技术,加上针锋相对的市场,Trinity所要迎接的挑战也是巨大的。考虑到错位竞争的需求,即便是最高端的A10也没有瞄准Core i7这样的旗舰产品,而是直接面向Core i5的市场,以图形的优势、四核的规格、OpenCL的全面支持挑战市场的主流产品。