英AI芯片独角兽正打入中国

来源 :海外星云 | 被引量 : 0次 | 上传用户:vpnyoyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  提起来自英国的芯片公司,ARM 可谓独揽美誉:这家只有不到 2000 人的公司,“统治” 着世界上 90% 以上的手机芯片,苹果、华为、三星所发布的各类芯片,归根结底还是 ARM-Base Chips。

  不过,新生代力量也未缺席。Graphcore 是其中的代表性公司。首先引发外界注意的是,这家公司的投资者名单中有不少 AI 领域的领袖级人物,包括 AlphaGo 之父、DeepMind 联合创始人哈萨比斯,剑桥大学教授 Uber 首席科学家佐宾·葛拉曼尼,加州大学伯克利分校教授彼得·阿贝尔,OpenAI 联合创始人格雷·布罗克曼等。明星机构投资者则有红杉等。
  随着今年年初宣布 1.5亿美元 D 轮融资,成立于 2016 年的 Graphcore 已筹集了超过 4.5 亿美元的风险投资基金,其估值达 19.5 亿美元。
  英国半导体之父、ARM 的联合创始人赫曼爵士曾对 Graphcore 的芯片给出很高期望:“在计算机历史上只发生过3次变革,一次是20世纪70年代的 CPU,第二次是20世紀90年代的 GPU,而Graphcore就是第三次革命。”
  充足的资金弹药,又有如此高的评价,也让 Graphcore 对其 2020 年的工作重点之一——吸引中国客户、打开中国市场颇有信心。

详解另类AI芯片产品代表——IPU


  Graphcore 将其开发的人工智能芯片命名为 IPU(Intelligent Processing Unit / 智能处理器),在 2018 年就已量产上市。
  过去几年,AI 芯片品类迎来产品大爆发,因此不乏一些颇为另类、甚至堪称疯狂的产品。比如在去年于顶会 Hot Chips,Cerebras Systems 就发布了史上最大半导体芯片 WSE,拥有 1.2 万亿晶体管,比最大的 GPU 大 56.7 倍。
  Graphcore 开发的 IPU 也有一些大胆的想法。在近日接受采访中,Graphcore 高级副总裁兼中国区总经理卢涛详细介绍了 IPU 背后的技术逻辑。

  Graphcore 认为,AI 应是一个全新的应用架构,它底层表征是以计算图作为表征的,所以需要一种全新的处理器架构,而且,常见的将 AI 计算区分为训练和推理也不是可取的分类方向,新的 AI 计算架构本来就应该要具备同时处理二者工作的能力。
  回顾处理器近年来的发展,从1个 teraflops 到10个teraflops再到现在的100个 teraflops,算力提升的速度非常之快。但在发布会上展示的算力规格无论是几个 teraflops,与现实往往有差距:有效的算力远远达不到峰值。造成这个现象的原因在于,芯片内存的带宽非常限制性能。当处理器算力提高 10 倍,那内存应该如何提高 10 倍的性能?传统的 DDR4、DDR5、HBM、HBM1、HBM2、HBM3 的内存解决方案等,基本上每一代大概能有 30%、40% 的提升。在这方面,与传统的 CPU、GPU 相比,IPU 用了大规模并行 MIMD 的处理器核。另外做了一个非常大的分布式的片上 SRAM,在片内做到 300MB 的 SRAM,相对 CPU 的 DDR2 子系统或者是相对于 GPU 的 GDDR、HBM 来说,可以做到 10倍~320 倍的性能提升。从时延的角度来看,与访问外存相比较,时延基本上就是 1%,可以忽略不计。
  另外,IPU 是一个标准的神经网络处理芯片,而且规模很大,通常具备数千到数百万个顶点,除了标准神经网络之外,也适用于贝叶斯网络(也称为信度网络、因果网络,是指基于概率分析、图论的一种不确定性知识的表达和推理的模型)和马尔科夫网络(马尔可夫网络类似贝叶斯网络用于表示依赖关系。但是,一方面它可以表示贝叶斯网络无法表示的一些依赖关系,如循环依赖;另一方面,它不能表示贝叶斯网络能够表示的某些关系,如推导关系),而因为架构具备弹性,未来的新模型与算法理论上也都能够完美支持。
  由于其庞大的顶点数量,远超出现有最大 GPU 的规模数百倍,这也意味着其在并行工作的处理潜力非常惊人。另外,这些顶点都是稀疏的,绝大多数顶点都只连结到其他一小部分顶点。另外,IPU 也是针对低精度的数据模型优化,也就是具备数据的统计近似值概念,这和过去超算的概念完全不同。另外,IPU 也支持了模型参数的复用。简单来说,卷积是空间复用,回归是时间复用。这些复用特性可以获取数据中的空间或时间不变性,对于训练与推理的性能会有明显帮助。
  从整体上看 IPU,目前已经量产的是 GC2 处理器,采用 TSMC 16nm 工艺。该处理器目前片内有 1216 个 IPU-Tiles,每个 Tile 中有独立的 IPU 核作为计算以及 In-Processor-Memory,即处理器之内的内存。所以对整个 GC2 来说,共有 7296 个线程,能够支持 7296 个程序并行运行。对整片来说,In-Processor-Memory 总共是 300 MB。
  据介绍,IPU 的整个设计思想是要把所有的模型放在片内处理。在各个核心之间的 BSP 同步,能支持同一个 IPU 处理器之内 1216 个核心之间的通信,以及跨不同的 IPU 之间做通信。这都是通过 BSP 的同步协议实现,之间还有一个非常高速的 IPU exchange、8 TB/s 的多对多交换总线。   另外,在 IPU 和 IPU 之间还有 80 个 IPU-Links,构成 320 GB/s 的芯片与芯片之间的带宽。如此一来,同一个处理器就同时支持了训练和推理。目前来看,IPU GC2 是世界上非常复杂的拥有 236 亿个晶体管的芯片处理器,在 120 瓦的功耗下有 125TFlops 的混合精度、1216 个独立的处理器核心(Tile)、300M 的 SRAM 能够把完整的模型放在片内,另外内存的带宽有 45 TB/s、片上交换 8 TB/s,片间的 IPU-Links 是 2.5 TB/s。
  而诸如 IPU GC2 有 1216 个核心(Tile)、7000 多个线程,解决并行硬件的高效编程问题又是一个非常大的课题。为此,Graphcore 采用构建大规模数据中心集群的 BSP 技术(Bulk Synchronous Parallel)。该技术目前在谷歌、Facebook、百度这样的大规模数据中心内均已得到应用。因而,IPU 也是目前世界上第一款 BSP 处理器,通过硬件能支持 BSP 协议,并通过 BSP 协议把整个计算逻辑分成了计算、同步、交换,对软件工程师或开发者来说十分友好。
  Graphcore 在 IPU 设计上应用了很多相当极端的想法,虽然理论上以其规模应该更适合放到云端,但 Graphcore 認为 IPU 架构拥有很好的伸缩性,边缘或是终端计算同样能良好胜任。

积极融入中国 AI 生态圈


  技术以外,和一些 AI 芯片公司其产品仍停留在 PPT 阶段不同,IPU 在 2018 年就已量产上市。目前,Graphcore 客户名单上已有微软、Citadel 和 Qwant。其中,最为外界瞩目的公司还是科技巨头微软。
  近年来,越来越多的科技巨头希望使用专门的人工智能硬件以加速数据中心,对高性能计算芯片的需求正在迅速增长。我们耳熟能详的几个名字正在该领域进行积极的收购和合作,例如,英特尔就曾斥资 20 亿美元收购了 Graphcore 的竞争对手、以色列公司 Habana Labs。
  显然,对初创公司来说,长期稳定的发展除了自身要有强大的实力外,与外界的合作联系也十分必要。2019 年 11 月,Graphcore 宣布与微软达成合作,在微软的云计算平台 Azure 上部署其 AI 处理器。此次合作不仅将增加 Graphcore 的AI芯片使用率,还有可能扩大其客户群。
  2020 年,Graphcore 的一个重要目标是开拓中国市场。近段时间,其融入中国 AI 生态圈的诸多进展得以公布:在 OCP Global Summit 上,阿里巴巴异构计算首席科学家张伟丰博士宣布了 Graphcore 支持 ODLA 的接口标准;在百度 Wave Summit 2020 上,百度集团副总裁吴甜女士宣布 Graphcore 成为飞桨硬件生态圈的创始成员之一,双方签署了倡议书。“Graphcore 策略上是要积极拥抱中国的 AI 生态圈。通过这样一种方式融入中国 AI 生态圈,在于我们认为除了像国际上比较流行的 TensorFlow、PyTorch 以外的框架,中国本土的机器学习框架也会有出色表现。

  长期来说,我们对中国市场的期望非常高,期望中国市场能够占到 Graphcore 全球市场的 40% 甚至 50%。虽然我们在中国市场的整体启动比北美晚了近一年,但从目前进展来看,前景还是非常不错的。” 卢涛表示。

市场竞争进入启动期,“有两类 AI 芯片公司或被淘汰”


  不过他也强调,生态以外,AI 芯片本质上仍需回归技术攻坚。以年初轰动业界的 Wave Computing 倒闭为例,其诞生之初也有着明星企业的光环,最终却黯然退场。
  卢涛认为,Wave Computing 的倒闭并不意味着 AI 领域遇到寒冬,“全球 AI 发展并没有走向低潮,今年反而会有更大发展。”据了解,自然语言处理是需要强劲算力的一大类 AI 应用。“NLP 相关技术的崛起会催生大量的、各种各样的应用,以及在算力方面的大幅提升。现在一般的 CV 类模型是几兆的参数、几百万或者几千万的参数,而更大一些的 NLP 模型,现都是1亿、10亿、100亿的参数容量,对算力的要求是指数级的。所以,我们认为,AI 芯片产业存在这样一个问题,即一个 AI 处理器从作为一个处理器到最后商业落地,其实中间的落差还是非常大的。”
  开发出芯片只是第一部分,出来之后配套的是不是有比较好的工具链,是不是能够有比较丰富的软件库来支撑主流算法,以及是不是能够跟主流的机器学习框架进行无缝连接,最后对用户来说展现的是比较好的可移植性或者是可开发性/可部署性,最终差距其实还有很多。所以,整个链条全部打通的话需要非常大的投入。
  而他也强调,有两种类型的 AI 芯片公司将会遭遇困境:一类是处理器仍未量产的公司;第二类是有了处理器,但对软件重视不够的公司。“没有足够投入的话,未来面临的会是困难局面。”“2020 年对 AI 芯片确实是非常关键的一年。因为全球有很多企业都在开发 AI 处理器,但是否这些处理器真能做出来、是否真的能够有一些场景落地?如果说拿不出来,那么对于后期持续化的投入,可能是一个非常大的挑战”。
  (摘自美《深科技》)(编辑/费勒萌)
其他文献
在网络教学资源建设中,元数据互操作作为解决网络教学资源整合问题的有效方案,受到了人们的普遍关注。为了提高元数据互操作的精度,我们必须对网络教学资源中的各种元数据有一个清晰的认识,必须对各种元数据的元素或字段设置、数据结构以及语义界定等方面进行比较分析。目前网络教学资源中的主流元数据主要有Dublin Core、LOM和MARC三种,其他元数据大多是在这三种的基础上或复用、或扩展而形成的。LOM是学
社交媒体是一个不断变化的系统,当人们已习惯当前的主流APP,如脸书(Instagram、WhatsApp)和谷歌(Gmail、AdSense)看似垄断的控制时,视频APP的流行满足了用户自我表达和互动的新需求,让富有创意和不拘一格的年轻人有了更好的平台,社交媒体影响者们的内容也发生了从“图文”向“视频”的转变。  我们从 6 位来自世界各地的 Instagram 影响者的自身经历,知晓了他们如何巧
曼谷现代城市景观  近年来因为泰国致力于发展城市建设和文创产业,加上物价低廉,已成为亚洲最受欢迎的观光地热点之一。但由于除了曼谷之外,语言的障碍和没有如大城市四通八达的捷运,如果自助游,还是以和国际接轨的曼谷为最佳的选择。计划自由行的观光客可按以下步骤来检视自己的行程: 一、签证  免签证国家: 凡持有效的美国、加拿大、澳大利亚、日本、欧洲联盟国家,最长可于泰国停留30天。  需要办理签证: 
本书不能算是一本完全意义上的新书,因为原著早在1969年就已经出版,此次的译本是依据1995年的修订版翻译的。之所以强调它的“身世”,是因为全书的文字风格已与现在具有明显的不同,并且其中涉及的内容都截止于20世纪上半叶。  本书主要描述了欧洲帝国时期对其他文化的态度问题,从历史文化角度揭示了欧洲殖民者对殖民地人民文化的态度及其成因。即,一方面欧洲以给世界其他民族带去文明与民主的“人类的主人”自居;
斯科特·凯利和马克·凯利是人类航天领域最传奇的双胞胎兄弟,两人都作为美国宇航局的宇航员多次进入太空。  斯科特 · 凯利曾经幻想能飞去火星,虽然最终未能如愿,但阴差阳错成为了国际空间站上的“人类试验品”,为未来的人类火星之旅留下了宝贵的实验数据。斯科特·凯利  凯利兄弟一同参与了美国宇航局火星计划中颇具野心的任务之一——双胞胎实验计划。斯科特和他的双胞胎哥哥马克共同参与了该实验计划,斯科特在太空生
近段时间以来,一部以晋商为题材的电视剧《乔家大院》的热播,引起人们对晋商的极大兴趣。该剧以晋商的杰出代表乔致庸的一生为主线,给我们讲述了一个可歌可泣的传奇故事。但由于该剧偏重于故事性和传奇性,所以对晋商并未进行深入细致的描写,而乔致庸一人也并不代表整个晋商史;另一方面,由于市面上关于晋商的书籍又多以历史事实为主,其研究性大于可读性,故此,本书编者本着为广大读者服务的目的,经过多方考究,在材料的使用
当地时间1月23日下午委内瑞拉总统马杜罗宣布与美国断交委内瑞拉已故前总统查韦斯  委内瑞拉最近乱局不断,官方和非官方的消息不断交织,甚至让人难以判断这个曾经富裕的南美国家究竟发生了什么,其实际领导人又是谁。  造谣一张嘴,辟谣跑断腿,在各路媒体追踪真相的同时,已经被绕晕了的普通读者,倒不如静下心来关注一下这个国家近年来的历史时间轴,或许能帮助你更好地了解委内瑞拉的现状。起:查韦斯时代  ——199
柬埔寨暹粒是个多面向之地,这地方不能算很现代化,却别有洞天。  提到世间穷奢极侈、纷华靡丽,人们一般都会联想起昔日的王室贵族。虽然昔日的王朝留下来的只有堂皇的宫殿和不朽的艺术,不难从遗迹中寻回旧时的辉煌。古老的柬埔寨王国虽然只留下了一座高庙山石窟,但这座古迹却是不平凡的雄伟壮观,艺术成就登峰造极。久经战火的柬埔寨人对吴哥窟崇高尊敬,视它为国宝,甚至为国家象征。  神秘的吴哥窟不但获得历史与文化学者
《华人纵横天下》是中国电视史上首部全景记录全球杰出华人的系列纪录片。该片制片人张克荣历时五年,数次越洋实地拍摄了108位全球各地华人的成功历程。在这些人物中,有新加坡内阁资政李光耀、悉尼市副市长曾筱龙,香港企业家李嘉诚、法兰西学士院院士程抱一、诺贝尔物理奖得主朱棣文、影视巨子邵逸夫……。该片在美国、日本、英国等国家的电台播出时,收视率都排到了当地的前十名。今年年初,中央电视台《人物》栏目在国内播出
英国脱欧僵局变成乱局之际,“始作俑”者前首相卡梅伦的回忆录出版,亚马逊网上书店预售阶段即登上政治类书籍畅销榜榜首。  2008年世界金融危机爆发,全球经济受重创,欧元区债务危机警报不断,中东政局动荡,伊斯兰极端组织IS甚嚣尘上,欧洲遭遇难民危机,欧盟内部分歧加剧。  2010年,保守党在连续三次大选失败后大翻身,卡梅伦上台,保守党和自民党组建了70年来第一个联合政府。  他在任的6年(2010年~