Silvermont架构:英特尔的反攻尖兵

来源 :新电脑 | 被引量 : 0次 | 上传用户:ghostKill1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  弹指一挥间,第一代Atom处理器发布到如今已经整整5年了,5年对于IT业界而言是一个不算短的时间。不过,Atom处理器却没有如英特尔期待的那样,复制它的前辈们在桌面和笔记本电脑平台上的辉煌:除了在上网本和一体机流行的时期有过短暂的惊艳表现之外,大多数时间它都纠结于并不出色的性能、令人难以接受的耗电量和较大的发热量之间。它的对手——ARM架构处理器则在新兴的智能手机和平板电脑市场中出尽了风头,甚至把触手伸向了服务器领域。
  但是平心而论,这5年来Atom处理器的进步可谓非常显著。无论是从晶体管数量、运算能力还是从微架构革新等方面来看,Atom处理器的发展速度都超越了摩尔定律的藩篱,甚至创造了x86处理器的多项“第一”,特别是x86架构SoC处理器实现了可谓革命性的进步。
  虽然此前英特尔似乎并未把精力过多放在Atom平台上,但目前这种情况似乎有所改观。Sivermont架构的Atom处理器有望成为英特尔在低功耗高性能处理器领域扭转乾坤的里程碑。
  Silvermont:英特尔的新微架构
  英特尔5月中旬刚刚发布了Silvermont微架构,这也是英特尔寄予厚望、对抗ARM Cortex A15内核的秘密武器。与上一代微架构Saltwell相比,Silvermont有着诸多新特性。
  全新的乱序执行引擎
  数年前的手持移动设备处理器,如ARM Cortex A8内核处理器、英特尔早期的Atom(Bonnell)以及高通的Scorpion处理器都采取“顺序执行”模式。从Coretex A9开始,ARM采用了乱序执行的设计,CoretexA15则采用更优化的管线进一步提升了性能。针对这样的形势,英特尔将Atom升级为采用了乱序执行引擎的Silvermont微架构也顺理成章。
  与此前的“Saltwell”微架构相比,Silvermont微架构的执行效率更高。前者流水线误预测为13个时钟周期,后者则仅为10个时钟周期。不过,英特尔尚未给出Silvermont具体的管线长度。参考Saltwell为16级管线,大致可以预测Silvermont的管线在14~17级之间。与乱序架构对应,Silvermont对分支预测器做出了改进,增加了一个间接分支预测器,这使得指令预测更加准确。两方面的改进使得Silvermont比Bonnel/Saltwell的每时钟周期指令效率提升了5%~10%。综合节能和性能考虑,英特尔在Silvermont微架构中仍然采用了双发射指令的结构(Cortex A15是3发射,目前的酷睿微架构为4发射)。
  多内核和新指令
  Silvermont微架构最多支持8个内核协同运算。由于目前新一代智能手机和平板电脑皆已采用四核处理器,因此更新的Silvermont支持到8个内核并不稀奇。考虑到Atom处理器的单个内核运算能力基本领先于同一时代的ARM处理器,所以可以预见,在今年年底发布的Silvermont系列处理器将再度夺得性能锦标。
  Silvermont微架构还能够支持64位运算。去年年底英特尔已经推出了基于Atom平台的64位服务器芯片S1200,功耗仅为6W。Silvermont微架构对64位运算的支持也符合时代的潮流。除了服务器的需求外,随着移动设备运算量的增大,64位运算的普及也势在必行。Silvermont微架构的竞争对手之一ARM Cortex A15仅支持32位运算,在这方面英特尔仍有一定优势。Silvermont微架构还支持SSE 4.1/4.2、POPCNT及AES-NI指令集,弥补了上代产品的缺憾。
  新的能效特性
  Atom处理器在节能方面表现不佳是此前它屡战屡败的原因之一,不过Silvermont处理器可望摘掉耗能大户的帽子。在Silvermont出现之前,Atom处理器已经支持英特尔的Turbo Boost技术,但它们的表现并不尽如人意。Silvermont微架构加入了硬件功耗控制单元,它可以监控处理器的发热并动态处理SoC芯片内各模块的功耗分配,在处理器温度允许的范围内,运行频率可以得到最大幅度的提升,TDP上限也可被短时超过。Silvermont也允许对单一CPU或GPU内核加速,从而提升效能。在处理器节能状态方面,Silvermont对C6状态模式进行了改进。新增加的“CacheRetention”(缓存留置)可使得二级缓存状态介于部分活跃和完全关闭之间,进一步提高了处理器的节能效果。
  制造工艺红利助推Atom
  Tick-Tock策略曾经有效地帮助英特尔摆脱了Pentium 4带来的困境,如今英特尔也把这套策略搬来对抗ARM。众所周知,英特尔拥有目前最为先进的半导体加工工艺,这使得它在新一代超节能处理器的竞争中占据优势。Silvermont微架构处理器将会采用英特尔已经成熟的22nm、3D晶体管工艺制造,而目前主流的ARM处理器还都在使用28/32nm工艺。
  在每晶体管耗能和漏电率方面,英特尔的22nm工艺占据着明显的优势。在工作电压为1.0V时,22nm工艺处理器比32nm工艺处理器快18%,而在0.7V工作电压时快37%,可见仅仅工艺提升就能够给同功耗的处理器性能带来将近20%~30%的提高。而用于Atom处理器的22nm工艺很可能还将获得进一步改进。借助这些进步,Silvermont微架构处理器单内核运行频率很可能达到2.5GHz级别,节电性也将进一步提高。就目前的情况来看,英特尔还将借助工艺优势推行Tick-Tock战略。目前已经可以确认,英特尔在下一代Atom处理器Airmont中将会采用14nm工艺生产,上市时间约为2014年下半年。
  Atom处理器家族四面开花
  基于Silvermont微架构衍生的新一代Atom处理器家族,目前已知的处理器有4种,四核的“Bay Trail-T”处理器芯片计划用于平板电脑,相关产品将在2013年圣诞节购物季推出。据称Bay Trail处理器的计算性能是英特尔目前平板电脑产品的两倍以上。此外,Bay Trail-M/D平台还将用于入门级笔记本电脑和低端一体式台式机市场,如近来流行的混合模式笔记本电脑等。根据英特尔方面的资料,与现在的处理器Atom Z2760相比,Bay Trail单线程性能有2~4.7倍的提升,多线程性能有2.5~4.4倍的提升,进步相当显著。频率较低,同时大幅降低能耗的“Merrifield”将用于智能手机平台,据英特尔表示,它的性能和电池续航时间均优于当前产品,还支持情境感知和个性化服务、面向Web流的超高速连接以及更高的数据、设备和隐私保护等功能。此外,“Avoton”将接替S1200处理器,进入数据中心内的微型服务器、存储和扩展性负载。它的特性包括64位指令集、集成结构、错误代码校正、英特尔虚拟化技术以及超强的软件兼容性等。“Rangeley”则主要针对网络和通信基础设施,比如入门级到中端路由器、交换机和安全设备。这两款产品均计划于今年下半年上市。   SoC芯片进军服务器
  早在数年之前,英特尔万亿次计算项目取得的成果就已经显示,多个小内核并行组成的处理器有能力进行高强度的运算,如同一大群蚂蚁和大象都有能力搬走一座米山那样。不过,在面对一些轻量的需求,如网络服务请求时,低能耗处理器可能更具备成本的优势。如果将至强处理器比作大象的话,那么目前的超节能处理器就是蚂蚁。尽管大象力气大,但每次需要运载的重量可能都远不及大象的承载力,很多能量被白白消耗;而蚂蚁尽管每次只能扛起一粒米,但蚁群可以根据米粒数量决定派出蚂蚁的数目,尽可能多地节约能源。有鉴于此,英特尔和ARM都把微服务器(面向大量的轻量需求)领域作为自家超节能处理器的重要发展方向。
  2012年年底,英特尔推出了面向微服务器的64位Atom处理器S1200,它的TDP仅为6W。惠普公司2013年4月份发布的服务器Moonshot就采用了这款处理器,该服务器的目标市场为云计算和软件定义服务器领域。惠普表示,Moonshot服务器能耗降低了89%,体积减少了94%,而且成本也仅为原来的37%。Moonshot可以满足呈指数增长态势的云计算需求。只要有10家大型网络服务供应商将它们传统的服务器换代为Moonshot服务器,它们每年就能节省总价值1.2亿美元的能源使用支出,并减少近100万吨的二氧化碳排放量,相当于减少了18万辆汽车的尾气排放量。而英特尔声称,还有约20家合作伙伴准备采用Atom处理器。
  x86尚需努力
  尽管业界对英特尔在SoC超节能处理器领域取得的进展给予肯定,但大部分评论者对Atom处理器的前景依然表示谨慎。毕竟此前的差距并非一代Silvermont就可以弥补,想要在这一领域呼风唤雨,英特尔还需要更加努力。而x86集团的另一位重要成员AMD目前尚未拿出令人信服的产品,或许注重图形表现的SoC处理器才是它的关注所在。
  Baytrail:首次磨刀
  Baytrail对英特尔来说,可谓十年磨一剑,除了在制程上首次令Atom赶上主流PC的22nm外,又是和酷睿微架构等价的Silvermont低功耗微架构的首款商业化产品。该产品融入了Turbo Boost技术,实现原理与下图所示的Sandy Bridge架构如出一辙,但是它具备更强的单个核心供电控制技术,在“低”下去的时候节能表现将大大提升。
  随着发展重点从保持30年优势的PC领域转向移动计算领域,英特尔将越来越多的技术引入移动平台。如果将Silvermont的发展轨迹与酷睿微架构的产品放在一起对比,那么明显可以看到其更新速度更快。在引入日益成熟的22nm工艺之后,移动平台产品将有望率先引入14nm工艺,光凭制程上的两代优势,Atom性能及低功耗表现就将大幅领先。
  管线周期
  Silvermont架构和前代的Saltwell架构相比,新增的乱序执行能力对管线深度提出了较高要求。为了避免Pentium 4 Willamette架构的超长流水线在分支错误返回浪费过多时钟周期,英特尔刻意缩减了Silvermont的管线,这也在很大程度上控制了核心发热量。
  顺序执行和乱序执行
  在最为理想的状态下,一条指令的执行按照如下的步骤进行:首先进行指令获取,如果该指令的运算对象已经在寄存器中,则指令会被发射到合适的功能单元执行,并将结果写回到寄存器中。但是,如果在当前的时钟周期下运算对象不在寄存器中(比如在内存中),那么处理单元会消耗一定的时间来等待它。对于顺序执行处理器而言,只有等待到运算对象之后,指令才能够被继续执行下去。乱序执行则将这段等待的时间利用起来:指令首先被存入指令缓冲区。如果运算对象并不在寄存器中,那么后面其他可执行的指令将会被先执行,结果写入另一个缓冲区。等到前面的指令执行后,再按照原先的顺序将指令写入到寄存器中。
  很显然,对于复杂和大量的指令,乱序执行的效率更高,但也需要处理器有更强的运算能力,这通常意味着会消耗更多的能源。因此,究竟采用顺序执行管线还是乱序执行管线,归根结底要取决于设计者对运算能力和能耗的平衡。早期ARM和Atom处理器出于对能耗的严苛要求,均设计为顺序执行,但随着人们对移动平台运算能力要求大幅度提高以及半导体工艺不断改进,乱序执行处理器逐渐成为宠儿。
  声音
  “通过我们的设计与制程技术的共同优化,Silvermont已经超出了我们预期的目标。借助我们在微架构开发领域的专长以及领先的制程技术,我们提供的技术包能够显著地提升性能和能效,同时具备更高的频率。我们为此成就深感自豪,并坚信Silvermont将为各种全新的低功耗英特尔系统芯片奠定强大而灵活的基石。”
  ——Belli Kuttanna 英特尔院士兼首席架构师
其他文献
在今年的Computex展会上,或者更确切的说,是在Computex开幕之前,索尼出人意料地在台北这个宏碁、华硕等厂商的主场,紧随英特尔发布Haswell的脚步,在6月5日发布了2013年秋季全新VAIO电脑产品。  策略调整  虽然VAIO进入我国台湾市场的时间不短,但是极少将这里作为其全球产品发布的会场,这里似乎始终处于其PC市场的边缘地带。从时间点来说,这个对VAIO非常重要的发布会“竟然”
期刊
影像传感器,如CMOS中的光电二极管采用半导体技术制造,以硅为主要原料,在栅极材料的选用上也主要以铝和铜为主,而在结构上则包括微透镜、RGB滤光片、布线层、硅光电二极管和基板。光线在穿透这些层的过程中,损失较大,尤其是在通过“深井式”的布线层传达至硅光电二极管时,会造成光线在入射角和传导方面均出现不小的损失。虽然背照式CMOS将布线层转移至光电二极管下方,减小了“深井”所造成的光线损失,但受制于硅
期刊
数据挖掘对于许多人来说都是一个陌生的领域,但恰恰又是与每一个人关系异常密切的领域,信息时代,几乎所有人的数据都会被收集和分析。那么,什么是数据挖掘?数据挖掘又如何影响着我们的生活呢?    根据最著名的数据挖掘著作《数据挖掘:概念与技术》和最新出版的数据挖掘著作《数据挖掘导论》的定义,数据挖掘是“从数据中提取出隐含的过去未知的有价值的潜在信息”,或者也可以说是“一门从大量数据或者数据库中提取有用信
期刊
苹果公司的iMac、iPhone、iPad、iPod和其他一些苹果产品的名称中都有一个“i”字,它代表着互联网(Internet),也代表着个人(individual),肯定也代表了集苹果创始人、CEO和“救世主”于一身的史蒂夫·乔布斯。1997年,当乔布斯返回苹果公司的时候,苹果正处在它最低潮的时期,那时苹果已经快要无法负担公司的债务了,诸如开发Java的Sun公司和数据库专家甲骨文这样的公司都
期刊
科学家克利福德·斯托尔有一个非常著名的安全提示:“像对待自己的牙刷一样保护密码,不要让任何人触碰它,并且每6个月就将它更换一次。”这个提示看似非常有道理,可执行性也很强,但是却已经不那么适合千变万化的网络世界了。现如今数以亿计的网上银行、网络站点和Web服务以及移动设备都使用密码作为最主要的验证手段。但是这些密码并不像牙刷一样躺在家中,它们同时还存储在服务商的服务器上,而服务器受到黑客攻击导致泄漏
期刊
目前,H.264是主流的视频编码标准。我们看到的赛事电视直播、MP4和MKV格式的电影或者点播的在线视频,都需要首先使用H.264编码器压缩成“连续的图片”,然后利用设备上的H.264解码器解码并以“视频”形式播放。2013年1月,下一代标准H.265,也称为HEVC(High Efficiency Video Coding)的标准已完成。与H.264相比,它最高可提升50%的编码效率,这意味着同
期刊
新的命名方式  Mavericks是OS X系统的第十个版本(版本号10.9),自此苹果将不再沿用近10年来“猫科动物”命名法,开始以苹果总部所在地加利福尼亚州的景点来命名。Mavericks是当地的一个冲浪地点。  多标签文件管理器  Finder是Mac电脑的文件管理器。在OS X Mavericks中,用户可以将多个Finder窗口集合到一个Finder Tabs窗口中,像使用浏览器一样进行
期刊
从iPad发布到如今的数年间,平板电脑成为了全球最受欢迎的电子设备,增长势头也非常迅猛。IDC的调查报告显示,在刚刚过去的2013年第一季度,平板电脑出货量达到了4 920万部,尽管比起拥有圣诞节购物季的去年第四季度下降了不少,但同比增长依然达到了142%。另一家公司NPD则预计2013年平板电脑全年出货量将达到2.565亿台,超过笔记本电脑(约2.033亿台)。尽管平板电脑看起来前景非常光明,但
期刊
1080p分辨率的屏幕意味着出色的画面质量,但仅有超高的图像清晰度是远远不够的。为什么?答案就在我们的测试中。  有点奇怪或者说不同寻常,大部分笔记本电脑显示屏的分辨率不过才略高于720p,但新一代旗舰手机就已经开始标配1080p分辨率的全高清显示屏了。我们详细测试了首批上市的1080p手机的性能表现,对1080p分辨率手机在日常使用中的优势有了较为全面的了解。本期,我们将对比HTC One和索尼
期刊
去年10月,Windows 8刚刚正式上市,代号Blue的下一版Windows便开始勾起人们的欲望。2013年5月,微软官方确认了Blue的正式名称为Windows 8.1,Windows 8和RT用户均可获得免费更新。在6月26日的微软Build年度开发者大会上,Windows 8.1更新包的预览版将通过应用商店分发。  6月初,微软Windows官方博客发布了一段Windows 8.1的介绍视
期刊