酷应用

NVIDIA GTC大会概览

百家作者：极客湾 2018-03-29 15:53:33

昨日凌晨0点开始，NVIDIA在美国圣何塞McEnery会议中心召开的GTC 2018大会，老黄公布了一些新品和技术方向，并调整了一些战略目标。

「Amazing science, amazing graphics, amazingproducts and amazing AI.」

▌新核弹

大会上，老黄首先发布了支持英伟达RTX技术的核弹级显卡——Quadro GV100。虽然这次并没有推出面向玩家的桌面级显卡，但这张新的专业级显卡着实强大，老黄当场给大家演示了RTX技术的强大。

要知道，这样惊为天人的电影级画质是实时渲染出来的！顶级的画质、顶级的价格，这张牛逼的GV100价格达到了约6万块钱（8999美元）。

性能方面，GV100基于Volta架构，采用32GB HBM2 ECC显存，5120个CUDA核心，640个Tensor。现场演示的《星球大战：电梯尬演》Demo是用2块GV100通过NVLink2连接，这意味着这台电脑拥有64GBHBM2显存、10240个CUDA核心，代替了传统渲染农场、可以极大提高效能和节省时间、空间。

每张 GV100可以提供7.3TFlps双精度性能、14.8TFlps单精度性能，以及118.5TFlps深度学习性能。NVIDIARTX内置的NVIDIA OptiX AI-Denoiser可以实时AI去噪，官方表示其性能相当于采用CPU方式的100倍。

▌“世界最大GPU”

几年前，NVIDIA发了P100和NVLINK后，推出了售价12900美元的深度学习超级计算机DGX-1，今年，又给大家带来了真·重磅核弹——DGX-2，核弹级的售价——399000大美刀（约合人民币250万）！

对于这份巨无霸套餐，老黄自己都说它就是世界上最大的GPU了。大会上老黄还宣布，新版的Tesla V100显存扩容了一倍。「5 年前 AlexNet 在ImageNet 上展示了突破性的能力，」黄仁勋说道，「它有 8 层，数百个参数。而今天我们能够看到数百层的神经网络，内含数十亿参数，深度学习模型经过五年的发展，体量扩大了 500 倍。」

这个新一代巨无霸DGX-2由16块Tesla V100组成，使用NVSwitch技术互相连接，它的芯片间传输速率达到了惊人的300GB/s、超越传统PCIe整整12倍，借助NVLink2最终形成14TB/s的通道。这是个什么概念，用老黄自己的话说就是，如果以一本电影1GB来算，14000部电影可以在1s内传输完成，并随即露出一脸微笑。

DGX-2搭载了2块Intel Xeon Platinum CPU、1.5TB内存、30TB NVMe SSD（最高60TB）、512GB HBM2显存、最高提供2PFLOPs（2000TFLOPs）即每秒两千万亿次浮点运算的深度计算能力，功率为10KW、重量350磅，所以说有多重磅呢？没错，就是这么重磅，它可能是有史以来第一个老黄单手举不起来的GPU。

它的意义在哪里？同样的性能，以往需要300台服务器、15个数据中心机架空间，如今体积缩小60倍、能效提升18倍！

（据说已经有矿老板们在筹资买来挖矿了……）

▌AI平台改进

如同往届，老黄对AI做了介绍，公布了一系列重要进展，其中包含Tesla V100 32GB GPU的2倍显存、革命性NVSwitch结构、全面的软件堆栈推动性能提升、深度学习核能站DGX-2、发布深度学习引擎TensorRT 4等等。NV表示相较于6个月前的DGX-1，这次的性能提升高达10倍！

老黄表示，基于在数据中心、汽车应用、以及包括机器人和无人机等嵌入式设备领域中，诸如语音识别、自然语言处理、推荐系统、以及图像识别等新功能的支持，面向深度学习推理的 GPU 加速正在获得越来越多的关注。

▌GPU加速

“The more GPUs youbuy，the more money you save（用越多的GPU，你就越省钱）”，老黄演讲之余还不忘diss一下摩尔定律，当然，老黄是有这个实力为前提的，基于GPU的特性，老黄调戏了一番英特尔。他们选择Skylake CPU做比较，这是CPU能够同时处理的花朵数量：

而下面是老黄的：

黄仁勋在观众的笑声中说到：“这个奇妙的系统编排层叫做Kubernetes，人生已经圆满”。

现在，NVIDIA GPU已经支持由Google孵育的Kubernetes容器编排系统了，它旨在优化GPU在超大型数据中心的使用，这包含成百上千GPU来加速机器的学习进程，并允许开发人员将这些容器带到多个云中、无需任何更改。NVIDIA向Kubernetes开源社区贡献了自家的GPU增强，机器学习的工作量往往很大，无论是所需的算力还是驱动它的数据。黄仁勋称：“现在我们已经有了所有这些加速框架和代码，然后该如何将它们部署到数据中心的世界中呢？比如 Kubernetes！它将为我们带来相当多的欢乐”。