全新架构来袭

来源 :微型计算机 | 被引量 : 0次 | 上传用户：lizhicong521

【摘要】

：

【出处】

：

微型计算机

【发表日期】

：

2015年8期

【关键词】

：

功耗架构处理器性能制程厂商

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　在不久前，ARM发布了旗下全新高端处理器架构C0rtex-A72以及全新的CCI-500总线，当然还有Mali-T800系列GPU。而在这其中最引人瞩目的就是Cortex-A72了。从CorteX--A9到Cortex-A15再到Cortex-A57，ARM在高端SoC处理器核心架构的发展上可谓不遗余力。那么，Cortex--A72表现究竟如何呢？是否能改善目前高端SoC处理器部分高耗能、高发热的局面呢？
　　ARM作为整个移动计算世界的旗舰厂商，在移动处理器的相关技术研发、突破上一直非常积极。2013年底，ARM发布了全新的Cortex-A57处理器架构，将整个ARM移动计算技术带向64位计算时代。不过，从目前使用Cortex-A57的处理器来看，这款架构在现有工艺下很难在性能功耗比和实际功耗表现上有所突破，比如目前比较热门的高通骁龙810就使用的是Cortex-A57，但是它的高功耗、高温度表现让很多移动设备厂商不得不通过大幅度降低频率、电压来获取比较正常的设备使用温度。之所以出现这种情况，处理器的架构设计较为激进和工艺进步比预想缓慢都是原因之一，尤其是架构设计，很大程度上决定了处理器的耗电情况。为了解决这个问题，ARM在2015年第一季度又发布了全新的Cortex-A72处理器架构，并宣称全新的设计配合即将到来的新工艺，能够有效解决目前64位Cortex-A57高功耗和高发热的问题。
　　很快，部分厂商就宣布购买了Cortex-A72的授权，诸如华为、联发科、瑞芯微、英伟达等厂商都开始准备基于这款架构开发全新的产品。不过，迄今为止，有关Cortex-A72架构的详细资料还非常缺乏，比如它究竟使用了怎样的指令发射接口、内部执行单元有怎样的改变、缓存体系是否大幅度改进，目前还不得而知。不过，ARM的发布会上和随后的一些厂商还是给出了有关Cortex-A72性能、功耗表现的蛛丝马迹。下面，我们一起来看有关Cortex-A72的一些令人关心的问题。
　　和Cortex-A57有点像——Cortex-A72概览
　　从前几代产品的发展脉络来看，Cortex-A72应该是Cortex-A57的深度优化版本。Cortex-A57采用了乱序执行、三发射设计、15级流水线。Cortex-A72在整体架构上和Cortex-A57基本类似，肯定是三发射、乱序执行设计，流水线深度可能会略有调整，整体结构方面应该针对性地对功耗和能耗比设计做出了优化。
　　除此之外，ARM提出Cortex-A72是替代Cortex-A57的产品，但是并没有给出Cortex-A53的替代处理器架构，ARM官方解释说Cortex-A53的确已经做到了极致，没有调整的必要了。实际上对这一款双发射、顺序执行的处理器来说，Cortex-A53展现出的优秀性能和出色能耗比，的确很少有全新架构的处理器可以达到，毕竟这是一颗以节能为设计优先的产品。
　　在ARM官网上，按照惯例ARM给出了有关Cortex-A72的架构简图。相比之前的Cortex-A57架构简图可以看出，Cortex-A72在这张图中的改进可谓非常不明显，依旧采用了支持ARMv8-A指令集的架构，兼容32bit和64bit，处理器每个簇最多可以支持四核心运作，协处理单元方面也是NENO SIMDEngine和Floating Point Unlf两个“老熟人”了，用于增强多媒体、浮点计算等应用的性能。缓存方面依旧是标志性的48KB一级指令缓存和32KB一级数据缓存，均可以搭配校验模块使用。其他方面诸如ACP、SCU、L2缓存（512KB到2MB自由配置，自选ECC）、总线方案（支持AMBA4或者AMBA5）都完全相同。
　　架构简图上的微小差异，似乎昭示着Cortex A72和Cortex-A57说不清道不明的关系。那么在性能或者功耗方面，Cortex-A72又有怎样的表现呢？
　　大幅度提升性能与降低功耗——Cortex-A72如此强悍？
　　接下来看性能。根据ARM的官方资料，如果以Cortex-A15作为1的话，那么Cortex-A57的性能可达1.96，Cortex-A72则达到了3.5的高度。当然，这也是有条件的，其中Cortex-A15的制程为28nm，Cortex-A57的制程是20nm，Cortex-A72的制程是16nm FinFET。特别标注出制程，除了表示工艺节点外，表明这样的性能必须在这样的制程下才有望达到。否则的话，较老的制程可能无法带来较高的频率，实现更出色的性能功耗比。此外，需要大家注意的是，ARM的官方资料中并没有表明频率等相关情况，因此性能的具体表现还得等产品上市后才能进一步明确。
　　说完了性能，自然就是功耗了。依旧来看ARM官方资料。ARM宣称，Cortex-A72的功耗最多相比之前的Cortex-A15降低了75%。这里同样标明了工艺，但是没有频率等信息，此外图中ARM还宣称Cortex-A57的功耗相比Cortex-A15降低了大约50%。我们知道，即使是28nm工艺的Cortex-A15对比20nm工艺的Cortex-A57，目前也很难有具体产品说功耗能降低50%的情况，那这是怎么回事呢？
　　请注意，ARM在官方功耗图上标注了一行小字：功耗测试基于在相同的工作负载。这是厂商为了尽可能凸显产品能耗比的一种常见做法。其测试方法是，使用不同的产品运行完全一样的工作，在整个运行过程中测试耗电量，并作出比较。换句话来说，这就是一种特殊状态下的性能功耗比测试方法，这种测试过程中性能高的处理器完成速度较快，考虑能耗和时间相关，性能较高的处理器可能会获取比较明显的优势。再加上测试目标工艺完全不同，尤其是16nm FinFET，能够显著降低芯片漏电等情况，因此最终结果差异如此之高。但是，在实际使用中，如果某个任务快速完成后，用户肯定不会等待一段时间才继续，而是紧接着进行下一个任务，任务和任务之间是不会停止的，这样的测试中，高性能处理器可能无法获得比较明显的功耗优势，因此几乎没有太多厂商在展示功耗时采用这种更接近实际的算法。　　此外，ARM还特别标明，如果采用了自家的big.LITTLE大小核设计的话，在综合应用型的测试中，在只使用Cortex-A72的基础上最多还可以继续降低功耗40%～60%，相当于Cortex-A15功耗的约15%，这个数据依旧是基于16nm FinFET完成，估计还是采用相同的工作负载来衡量。
　　Cortex-A72的实测数据，泄露了哪些信息？
　　对于一款今年二月才发布的产品来说，如果要给出全面的性能报告，那显然是非常困难的。但是，部分测试资料还是渐渐流出。尤其是前不久华为给出的一组Cortex-A72和Cortex-A57等产品的功耗对比情况，信息量很大，暴露了很多具体内容。
　　根据表格数据来看，Cortex-A72同频率下相比Cortex-A57性能提升约5%，功耗降低了约17%，性能功耗比依照上表数据，Cortex-A53可看做3.33（500/150），Cortex-A57则是1.45，Cortex-A72则是1.85（820/441）——Cortex-A72的性能功耗比相比Cortex-A53提升了27%，考虑误差等情况，可以看做大约30%。不过，华为没有说明这是在怎样的工艺下达成的，可能是16nmT艺，尤其是考虑华为最近和台积电在16nm工艺合作上的传闻的话。这样看来，Cortex-A72的功耗降低还是比较有效的。
　　那么，Cortex-A72相比Cortex-A57，在相同工艺下功耗降低、能耗比提升的根本原因是什么呢？数据显示Cortex-A72的芯片面积相比Cortex-A57降低了0.3平方毫米，大约8.3%。两者在相同工艺下有明显的面积差距，原因极有可能是晶体管数量降低。也就是说，Cortex-A72相比Cortex-A57，使用的晶体管更少了，完成任务的能力更强了，这可能是能耗比提升的“终极黑手”。处理器等产品发展到现在，在晶体管方面几乎穷尽了所有的潜能，除了宏观架构上的一些调整会降低瓶颈从而带来性能提升外，处理器性能提升基本都只依靠晶体管数量的上升。在Co rtex-A72上，ARM通过使用新架构、新设计，以及Cortex-A57部分经验的融入，在降低晶体管数量、缩小核心面积的情况下还达成了这个成绩，这不得不说ARM设计功力又上了一层楼。
　　回头去看官方数据，ARM宣称最多降低75%是和28nm时代的Cortex-A15相比，整体可比性意义不大，因为消费者总会和同期的具体产品相比，而不是和数年前的老工艺和老架构。目前这些资料显示，Cortex-A72在架构上的调整带来了一定的功耗降低，而相比20nm Cortex-A57甚至28nm的Cortex-A15而言，官方宣传中大部分的功耗降低实际上是来自于16nm FinFET工艺，这种先进工艺依靠“站立”的栅极能够有效降低漏电电流，同时缩减晶体管体积，降低驱动电压，从而带来性能功耗比的有效提升，这才是Cortex-A72的最大优势。总的来说，架构改进带来了大约30%的能耗比提升，工艺再带来不少于30%的能耗比提升，Cortex-A72的75%能耗比优势还是可以确立的。不过这仅仅是理论数据，不考虑应用场景，实际情况还是得等产品上市后才能最终确认。
　　2016年才能大规模上市
　　目前Cortex-A72的相关内容就介绍完成了。那么还有一个疑问需要解决。Cortex-A72的相关产品什么时候上市呢？根据ARM的资料，现在厂商拿到Cortex-A72的设计资料和架构等内容，安排开发自己的产品需要大约三个月至半年，然后又需要大约三个月左右的流片、试产等，再交由手机厂商开发和使用，这最快又需要一个季度。也就是说，离Cortex-A72的相关产品大规模上市，至少还需要最快三个季度（也就是2015年底或者2016年年初），如果中间遇到诸如工艺和架构上的问题的话，那么可能还要拖延一段时间。保守来看，Cortex-A72的相关产品大规模上市，可能要等到2016年中期了（对比2013年底发布的Cortex-A57，到现在还难产上市，Cortex-A72可谓神速了）。对Cortex-A72感兴趣的用户，你们还需要耐心等待一小段时间，才能享受到科技的魅力。

其他文献

创新双动铁入耳式耳塞

测试手记：我们建议为Aurvana In-Ear3配备一款底噪控制很好的播放设备，因为它的高解析力会将这部分信息放大，如果底噪过大会影响听感。　　Aurvana系列是创新耳机产品线中的王牌，其中既有Aurvana Air这样的高端型号，也有In-Ear2这样的口碑产品。今天体验的In-Ear3是Aurvana系列的新品，1499元的售价注定了它的中高端定位，而双动铁单元入耳式设计则是对这一市场定位

期刊

耳塞很好声场导管单元低频

“超级雕”重装上阵技嘉Z490AORUS MASTER深度评测

即使仍然沿用14nm 生产工艺，内部架构仅有小幅提升，但凭借更高频率和更多核心数，以及全面开放超线程技术，第十代酷睿处理器的确是英特尔近几年来性能增长幅度最大的一代产品。例如，其旗舰产品酷睿i9-10900K的综合性能就大幅领先酷睿i9-9900KS。正因如此，酷睿i9-10900K发布之后便获得不少高端玩家的青睐。事实上，对于绝大多数高端玩家来说，选处理器倒不是一件难事，但在选主板这件事上却难

期刊

主板这款插槽技嘉电路更高

基础架构大提升解析ARM Neoverse N1和E1平台

ARM近期发布的两个全新平台指向了新的市场，甚至有挑战AMD和英特尔的可能。不过历史上ARM多次试图进入利润率更高的服务器或计算市场，然而都铩羽而归，那么这一次ARM会成功吗？新的平台又有哪些特性呢？　　在移动计算市场拥有领先地位的ARM，却一直在桌面计算、服务器等对性能要求更高的市场中表现不佳。诚然在过去数年中，ARM不止一次对高性能领域发起冲击，但结果并不理想。回头来看，ARM主要缺乏的是一整

期刊

缓存平台核心架构处理器控制器

百瓦级快充竞赛 20分钟怎么充满电?

5G时代，随着性能的增强、应用场景的丰富，手机终端耗电量进一步提升。在电池容量无法大幅增加的情况下，提升快充功率是拯救“电量焦虑症”最直接有效的办法。7月15日，OPPO发布了新一代125W超级闪充技术，率先进入百瓦快充领域;iQOO宣布将在8月发布的新旗舰手机上应用120W超快闪充技术;小米120W快充手机通过3C认证......一时之间，手机快充领域风起云涌，掀起一场百瓦级的“军备竞赛”。　　

期刊

电荷电流手机技术电池电芯

考试结束，暑假到来买台RTX游戏本嗨翻天

2020年这场不寻常的高考总算落下帷幕。对于高中生而言，经历紧张的高考之后，放下厚厚的书本，在暑假买台游戏本去畅玩喜爱的游戏可以说不失为一种放松自我的方式。那么购买游戏本该如何去挑选？显卡到底应该选GTX还是RTX呢？　　游戏本的大繁荣时代　　今年的游戏本市场和去年相比有着很大的不同，在我们看来今年的市场迎来了大繁荣时代。去年，大多数游戏本还是以英特尔处理器为主，而AMD仅仅是靠先头兵锐龙73

期刊

游戏显卡三星机型英特尔性能

一个竞争大时代的开启

今天来八卦一下。　　最近的DIY圈很热闹，非常热闹，真的。而起因，则是AMD借着7nm制程工艺单挑NVIDIA Intel。　　坦白讲，我个人已经感觉DIY圈儿已经有很久很久没有像现在这样热闹过了。对于DIY圈儿的芯片产业三巨头NVIDIA Intel、AMD来说，在很长很长的一段时间内，应该是自K8时代之后吧，AMD无论是在CPU领域还是在GPU领域，都一直处于相对弱势的地位。在CPU领域，自从

期刊

市场显卡产品是在处理器性能

儿童乐学伙伴

在生活中，可能你是一个工作达人，全国各地到处跑，许久才见孩子—次；可能你是外出打工者，每半年才回家一次，连听孩子叫妈妈爸爸的时候都不多；更多的时候可能是临时有事，把孩子留在家里做作业或者让爷爷奶奶帮忙带孩子，这个时候，如何能随时和小孩交流呢？别担心，小西机器人帮你忙。　　可爱的外观　　一个产品在大人和小孩眼中的好坏标准是不同的，对于小孩来说，一个产品的好坏绝对要看该产品的外形是否可爱，而小西机器人

期刊

小西机器人儿童功能视频的是

好用不贵CVN B365M GAMING PRO V20主板

为了降低用户的电脑组建成本，除了Z370、Z390，英特尔还推出了便宜不少的B360芯片组。而在长时间了解用户的实际使用情况后，最近英特尔又带来了最新的B365芯片组。B365芯片组是B360芯片组的实用化改进版本，针对NVMe SSD的流行，原来B360主板仅有的12条PCIe 3.0通道显然有些不够用了，因此在B365芯片组上，英特尔将PCIe 3.0通道数大幅增加到20条，并将M.2SSD接

期刊

主板芯片组散热片处理器采用了英特尔

怎样才能统治“吃鸡”战场?

目前，热衷于FPS游戏的玩家几乎无一例外地追求游戏中的高帧率。在他们心目中，60fps已经过时，144fps甚至更高帧率才是流畅游戏标准。为什么电竞玩家会热衷于高帧率，不同帧率下的游戏体验究竟有何差别，高帧率能否成为FPS游戏玩家收割战场的游戏利器呢？我们不妨一起来探究一下。　　显卡是降低游戏延迟的关键　　从原理上来讲，在我们玩游戏的时候，从按下鼠标或键盘发出相关游戏指令，到最后通过显卡的视频输出

期刊

游戏显卡战区玩家这款技嘉

搭载顶级120Hz高刷直屏　一加8T

在一加手机的阵营中，后缀为T的机型多为半代升级款，不过一加8T『以乎有些不一样。相较一加8，一加8T在造型和屏幕方面都有显著差异，与其说一加8T是一加8的半代升级款，不如说一加8T是一加7T的隔代升级，毕竟它们拥有相似的造型和同样的AMOLED直屏。那么这款以120Hz高刷新率直屏为主打卖点的一加8T有何过人之处呢？我们一起来看看。　　产品参数　　CPU 高通骁龙865　　GPU Adren0 6

期刊

曲面刷新率屏幕像素机型游戏

全新架构来袭

与本文相关的学术论文