英伟达联手京东打造全球首座智能配送城,拉BAT滴滴秀A100中国云朋友圈。
作者 | 心缘
编辑 | 漠影
芯东西12月15日报道,距离2020年末还有两周,今天,NVIDIA 2020年全球GPU技术峰会的最后一站——GTC China大会如约而至,又到了英伟达(NVIDIA)年终晒中国朋友圈的时候了。
受疫情影响,数万名与会者在线上参与此次技术盛会。与以往不同的是,整场活动更加强调技术研究和落地进展,并没有释放出新的产品。
这次打头阵的,不再是今年前几场GTC大会中在厨房砧板前发表演讲的NVIDIA首席执行官黄仁勋,而换成了NVIDIA首席科学家Bill Dally。
▲NVIDIA首席科学家Bill Dally
这位著名的计算机科学家在1小时的主题演讲中,介绍了NVIDIA各类AI研究的最新进展,并分享了其研究实验室正在进行的关于AI推理、硅光子学及GPU集群加速的三项最新研究。他相信,不仅图形的未来是AI,几乎所有东西的未来都是AI。
在Bill Dally主题演讲后,来自NVIDIA的5位资深专家分别介绍了在AI、数据科学和医疗健康领域的多项突破性技术如何在中国的具体应用。
对于颇受关注的NVIDIA收购Arm一事,NVIDIA全球业务运营执行副总裁Jay Puri回应道,Arm是一家了不起的公司,CPU每年销量约220亿个、开创了IP许可模式、产品性能非常高,其成功集中在移动端和嵌入式领域,但想要涉足云数据中心和PC领域还很棘手,x86占据完全的主导地位。
而NVIDIA在数据科学和人工智能领域有强大的生态,一旦Arm成为NVIDIA的一部分,NVIDIA将着重促进Arm在数据中心、PC和云计算领域取得成功。
针对一些公司担心Arm授权被限制的问题,Jay Puri说,人们对出口管制法的运作方式存在些许误解,无论Arm是归属软银还是NVIDIA,所有关键技术都在技术诞生地英国剑桥研发,NVIDIA已承诺收购完成后,英国剑桥还将是未来Arm技术的研发中心。
此外,面向AI和数据科学领域创企的孵化项目NVIDIA初创加速计划(NVIDIA Inception)邀请了12家中国创企出席此次大会,展示他们如何基于NVIDIA技术实现不同领域的创新。
01.
Bill Dally:NVIDIA在AI推理、硅光子学及GPU集群加速的最新研究进展
在系统介绍NVIDIA的软硬件布局及先进技术后,NVIDIA首席科学家Bill Dally以三个项目为例讲述了自己带领的200人研究团队如何成功实现“黄氏定律(Huang’s Law)”。这则以黄仁勋名字命名的定律,预测GPU将推动AI性能逐年翻倍。
过去八年,NVIDIA将单芯片推理性能提高了317倍。“如果我们真想提高计算机性能,黄氏定律就是一项重要指标,且在可预见的未来都将一直适用。”Dally说道。
Dally曾负责NVIDIA在AI、光线追踪和高速互连领域的相关研究。他着重分享了三项新的研究方向。
1、超高能效加速器MAGNet
推理是一个复杂的问题,不止涉及计算。NVIDIA MAGNet工具生成的AI推理加速器在模拟测试中,推理能力可达每瓦100 teraops,比目前的商用芯片高出一个数量级。
该工具采用了一系列新技术来协调并控制通过设备的信息流,最大限度地减少数据传输,从而节约能耗。这一研究原型以模组化实现,因此能够灵活扩展。
2、比电气链路更快速的光链路
NVIDIA研究团队也在研究用更快速的光链路取代现有系统内的电气链路。该团队正与哥伦比亚大学的研究人员密切合作,探讨如何利用电信供应商在其核心网络中所采用的技术,通过一条光纤来传输数十路信号。
电信号因自身限制,传播距离只有1/3米,而光信号的传播距离有20-100米,只需一个单条NVLink便可连接至更大规模的系统。
这种名为“密集波分复用”的光学技术, 有望在仅1毫米大小的芯片上实现Tb/s级数据的传输,是如今互连密度的10倍以上。
除了更大的吞吐量,光链路也有助于打造更为密集型的系统。Dally举例展示了一个未来借助光链路传输、可搭载160多个GPU的NVIDIA DGX系统模型。
3、全新编程系统原型Legate
软件方面,为了简化编程步骤,NVIDIA研究人员开发了全新编程系统原型Legate。开发者借助Legate,即可在任何规模的系统上,运行针对单一GPU编写的程序,既适用于Jetson Nano、单卡A100,也适用于搭载数千个GPU的巨型超算。
Legate将一种新的编程速记融入了加速软件库和高级运行时环境Legion,目前它正在美国国家实验室接受测试。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/91.html