阿里云蒋江伟:我们致力于为世界提供70%的算力

百家 作者:InfoQ 2020-06-13 13:37:59

6 月 9 日,2020 阿里云峰会在云端召开,阿里巴巴合伙人、阿里云智能基础产品事业部高级研究员蒋江伟出席峰会并做了题为《新基建,新算力:阿里云基础设施算力全新升级》的重磅发布。(以下内容为演讲实录)
云计算在企业应用中的价值与意义

大家好,我是阿里云小邪,今天我在阿里云飞天园区的云计算博物馆。在我身后是一个阿里巴巴历史上标志性的技术:2013 年 5 月,阿里巴巴最后一台小型机在支付宝下线。这标志着阿里云从 2009 年以来自研的飞天操作系统,到 2013 年完成了 IOE 整体的替换过程,代表着面向互联网、面向云计算的新技术不断在阿里巴巴演进。今天,我也在云计算博物馆给大家带来最新的阿里云技术和产品的发布。

今天,大家都在讨论国家的新基建。我认为,创新是驱动国家高速发展的真正源动力,而阿里云是推动创新的新基建、新底座。

在过去一段时间的疫情期间,我们发现,在教育、直播相关的领域,流量出现了暴涨。很多的业务受到了巨大的挑战。同时,不少在线业务都得到了爆发式增长的机会。一方面,流量爆发增长;另一方面,缺少足够的计算资源。

利用云计算,可以规避这样的问题:通过自助服务的方式,可以获得足够的计算资源,供应链的问题可以有效得到解决。以钉钉为例,我们实现了分钟级一千个集群的快速交付。另外,在疫情期间,我们也帮助了很多科研机构来开展针对新冠药物的筛选工作。

阿里云对于国计民生的一些工作进行了支持。像国家电网,通过阿里云接入了 5.4 亿个智能终端,覆盖用户 4.5 亿户。

对业务的支撑和高速发展,最核心的基础是算力。过去几年以来,阿里云持续不断地在对算力进行创新、演进和突破。我们致力于为世界提供 70% 的算力。

今天,我宣布第七代 ECS 高主频实例发布。

大家可以回顾过去十年,阿里云从第一代到第六代的计算实例。我们从 Xen 的架构,到 KVM 的架构,最后到自研的神龙架构。我们第七代实例的技术核心就是基于第三代神龙架构进行研发的。

现在来看一下第七代计算实例的一些性能指标:

从计算性能来看,第七代 ECS 高主频实例提升了 160% 的性能;从计算实例的规格来看,最高能达到 192 核的 CPU;存储延时下降了 70%,性能提升两倍,存储的延时进入微秒时代;我们提供了 2400 万 PPS 的网络转发能力,全面升级到 100G 的物理网络;容器网卡密度提升 6 倍,传输效率提升 5 倍。

有人可能觉得用不上这么高的性能,其实不然。以我的经验来看,大量的在线业务,尤其是缓存这类的场景,都需要超过百万的吞吐能力。极高的网络转发能力可以帮助这样的产品、系统提高吞吐能力。

计算型实例最关键的指标,就是更高的稳定性。我们发布了世界上最高级别的弹性 SLA,同时我们也通过硬件的方式实现了 QoS 策略,可以满足不同业务场景的差异化需求。像 EDA 设计、在线游戏、基因分析、远程教育、在线购物等等各种互联网、大数据的场景,阿里云都提供了强有力的支撑。以游戏场景为例,这一次计算性能的升级可以大幅提升同一个房间的在线用户数以及游戏体验。

接下来我宣布,含光 800 云服务器大规模商用。

大家应该还记得我们在去年云栖大会发布的含光 800 芯片。到今天,我们对含光 800 云服务器已经实现了大规模商用。在 AI 推理场景,一个含光 800 芯片的算力相当于 10 个主流 GPU。同时它也兼容多种主流框架,包括 TensorFlow、MXNet、Caffe、ONNX,提供了更丰富的场景,适配性也更强。

接下来的重磅发布,是云原生裸金属 ACK 方案。

云上的客户,尤其是阿里云的客户,都有一个共识,就是容器和物理服务器是最佳搭档。

传统的物理服务器有很多缺陷。第一,运维复杂度很高;第二,缺乏弹性。而基于神龙架构的裸金属服务器提供了非常好的弹性能力,同时具备了虚拟机运维的灵活性,所以生来就是最佳载体。

云原生裸金属的容器具备极致的弹性、高效的调度能力、全面的安全。所以相比自建容器,云原生 ACK 的 QPS 提升了 30%,计算成本下降 50%,安全容器的性能也提升了 30%。

像外卖的场景,一般在晚餐、午餐出现业务峰值,需要在这个时间点快速交付计算资源。ACK 是最好的选择。

下面我们来看两个 ACK 的 demo 演示。

第一个,我们来看一下 ACK 的高效调度。

接下来,我们来看第二个 Demo,ACK 高效调度含光芯片的资源,把多个业务同时调度到一个芯片上,极高地提高了资源利用率。

前面我们重磅推出了三个产品。第一个是 ECS 第七代高主频实例,这是一个里程碑式的发布,代表着整个行业里最先进的计算实例,最高的性能,最有竞争力的计算能力;第二个,我们发布了含光 800 云服务器的大规模商用;第三个,我们发布了云原生容器加新一代裸金属服务器 ACK,通过容器和神龙的完美组合,实现了极高的调度能力。

以上我们提到的核心技术进步,都来自于阿里云飞天的十年自研。我们有神龙计算平台、盘古存储平台、洛神网络平台。整个飞天操作系统的沉淀和提升,都源于这三个底层平台的持续演进与积累,也驱动着客户业务的不断进步。

阿里云致力于保障客户业务的连续性,激发客户业务的持续创新。




点个在看少个 bug 

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接