NVIDIA GTC大会概览

百家 作者:极客湾 2018-03-29 15:53:33

昨日凌晨0点开始,NVIDIA在美国圣何塞McEnery会议中心召开的GTC 2018大会,老黄公布了一些新品和技术方向,并调整了一些战略目标。

 

「Amazing science, amazing graphics, amazingproducts and amazing AI.」



▌新核弹



大会上,老黄首先发布了支持英伟达RTX技术的核弹级显卡——Quadro GV100。虽然这次并没有推出面向玩家的桌面级显卡,但这张新的专业级显卡着实强大,老黄当场给大家演示了RTX技术的强大。



要知道,这样惊为天人的电影级画质是实时渲染出来的!顶级的画质、顶级的价格,这张牛逼的GV100价格达到了约6万块钱(8999美元)。

 

性能方面,GV100基于Volta架构,采用32GB HBM2 ECC显存5120个CUDA核心640个Tensor。现场演示的《星球大战:电梯尬演》Demo是用2块GV100通过NVLink2连接,这意味着这台电脑拥有64GBHBM2显存、10240个CUDA核心,代替了传统渲染农场、可以极大提高效能和节省时间、空间。

 

每张 GV100可以提供7.3TFlps双精度性能、14.8TFlps单精度性能,以及118.5TFlps深度学习性能。NVIDIARTX内置的NVIDIA OptiX AI-Denoiser可以实时AI去噪,官方表示其性能相当于采用CPU方式的100倍



 

▌“世界最大GPU”

 

几年前,NVIDIA发了P100和NVLINK后,推出了售价12900美元的深度学习超级计算机DGX-1,今年,又给大家带来了真·重磅核弹——DGX-2,核弹级的售价——399000大美刀(约合人民币250万)



对于这份巨无霸套餐,老黄自己都说它就是世界上最大的GPU了。大会上老黄还宣布,新版的Tesla V100显存扩容了一倍。「5 年前 AlexNet 在ImageNet 上展示了突破性的能力,」黄仁勋说道,「它有 8 层,数百个参数。而今天我们能够看到数百层的神经网络,内含数十亿参数,深度学习模型经过五年的发展,体量扩大了 500 倍。」



这个新一代巨无霸DGX-2由16块Tesla V100组成,使用NVSwitch技术互相连接,它的芯片间传输速率达到了惊人的300GB/s、超越传统PCIe整整12倍,借助NVLink2最终形成14TB/s的通道。这是个什么概念,用老黄自己的话说就是,如果以一本电影1GB来算,14000部电影可以在1s内传输完成,并随即露出一脸微笑。



DGX-2搭载了2块Intel Xeon Platinum CPU1.5TB内存30TB NVMe SSD(最高60TB)512GB HBM2显存、最高提供2PFLOPs(2000TFLOPs)即每秒两千万亿次浮点运算的深度计算能力,功率为10KW、重量350磅,所以说有多重磅呢?没错,就是这么重磅,它可能是有史以来第一个老黄单手举不起来的GPU。

 

它的意义在哪里?同样的性能,以往需要300台服务器、15个数据中心机架空间,如今体积缩小60倍、能效提升18倍!

 

(据说已经有矿老板们在筹资买来挖矿了……)

 

 

▌AI平台改进

 

如同往届,老黄对AI做了介绍,公布了一系列重要进展,其中包含Tesla V100 32GB GPU的2倍显存、革命性NVSwitch结构、全面的软件堆栈推动性能提升、深度学习核能站DGX-2、发布深度学习引擎TensorRT 4等等。NV表示相较于6个月前的DGX-1,这次的性能提升高达10倍!



老黄表示,基于在数据中心、汽车应用、以及包括机器人和无人机等嵌入式设备领域中,诸如语音识别、自然语言处理、推荐系统、以及图像识别等新功能的支持,面向深度学习推理的 GPU 加速正在获得越来越多的关注。





▌GPU加速

 

“The more GPUs youbuy,the more money you save(用越多的GPU,你就越省钱),老黄演讲之余还不忘diss一下摩尔定律,当然,老黄是有这个实力为前提的,基于GPU的特性,老黄调戏了一番英特尔。他们选择Skylake CPU做比较,这是CPU能够同时处理的花朵数量:



而下面是老黄的:



黄仁勋在观众的笑声中说到:“这个奇妙的系统编排层叫做Kubernetes,人生已经圆满”。

 

现在,NVIDIA GPU已经支持由Google孵育的Kubernetes容器编排系统了,它旨在优化GPU在超大型数据中心的使用,这包含成百上千GPU来加速机器的学习进程,并允许开发人员将这些容器带到多个云中、无需任何更改。NVIDIA向Kubernetes开源社区贡献了自家的GPU增强,机器学习的工作量往往很大,无论是所需的算力还是驱动它的数据。黄仁勋称:“现在我们已经有了所有这些加速框架和代码,然后该如何将它们部署到数据中心的世界中呢?比如 Kubernetes!它将为我们带来相当多的欢乐”。



此外,NVIDIA宣布推出新版TensorRT推理软件——TensorRT 4,并将其集成到Google的TensorFlow(1.7)框架了。它可以将计算机视觉、神经网络机器翻译、自动语音识别、语音合成等深度学习推理速度加快190倍(对比CPU)

 



▌蛋疼的事情

 

英伟达对上周Uber自动驾驶车祸事故也做出了回应,因为他们扮演了Uber无人车后台计算的角色、是Uber无人车的合作伙伴,所以他们重新反思了自动驾驶技术的训练流程,会现在模拟环境中控制进行测试,通过海量模拟还原实际情况,通过自家的SIM人工智能对自己百般刁难,从而避开实际上几乎不可能发生的事故。



之后,老黄还现场演示了一段通过VR设备远程控制车辆的实际演示,是不是有一种《黑豹》电影里的感觉?



与此同时,老黄表示英伟达将暂停研发无人车技术,但发布了自动驾驶汽车仿真系统DRIVE Constellation,但蛋疼的事情来了,英伟达当日股价应声下跌。但是自动驾驶对于未来而言是绝对必要的,这是个绕不过去的坎儿,相信NV能够挺过难关、推动社会发展!

 



▌总结

 

这次NVIDIA GTC的重点在于渲染处理、人工智能、自动驾驶等等,着手于挖掘GPU极限性能,因为业务的扩大,自己的对手已经不仅仅是AMD了,他们还需要和汽车厂、医疗器械厂、工业机器人制造商等进行合作、竞争,而至于我们玩家关心的游戏显卡嘛……等着吧您呐~





戳图片传送至往期精彩

喜欢我们的推送别忘了点一个顶

向亲朋好友推荐一下我们的文章

或者赞赏一下

我们下期再见啦!

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接