抗住 8 亿人买买买!双 11 背后黑科技大曝光

百家 作者:程序人生 2020-11-12 15:20:33

作者 | 马超
责编 | 伍杏玲
出品 | CSDN(ID:CSDNnews)
“双 11”、“618”等活动已由原来单纯电商促销变成经济增长的引擎,今年“双 11”恰逢疫情管控降温,消费报复性反弹的最佳时点。 据官方信息,11 月 1 日至 11 日 0 点 30 分,2020 年天猫双 11 全球狂欢季实时成交额突破 3723亿。据天猫预计,今年双 11 的参与人数将达到创纪录的 8 亿人。值得一提的是,11 日 0 点 26 秒,天猫双 11的订单创建峰值就达到 58.3 万笔/秒,阿里云又一次扛住全球最大规模流量洪峰!
去年双 11 阿里最大的亮点就是将核心系统全面上云,今年双 11 阿里推出掌握214 种语言的“直播实时翻译”机器人,阿里的翻译机器人可以轻松应对电商直播中嘈杂环境、口音不标准及口语化语言风格等问题,帮助全球用户跨越语言障碍。
直播实时翻译
令笔者惊艳的是在物流配送环节,阿里在今年云栖大会上首发“物流机器人小蛮驴”,小蛮驴将在浙江大学紫金港校区承担浙大菜鸟驿站 3 万多件包裹的送货上门服务。机器人接管物流成为现实,期待小蛮驴能够真正解决之前骑手困在系统里的尴尬。
作为一名 IT 人,笔者最为关心的是,到底是什么黑科技支撑了今年的双十一期间的各类爆款产品。

抗住 8 亿人买买买,云原生加持

在阿里的双 11 技术沟通会上,阿里集团 CTO 鲁肃表示,天猫双 11 已成为全球最大规模数字创新工程,阿里巴巴在 2020 年双 11 完成全球最大规模的云原生实践,万笔交易的资源成本较 4 年前下降 80%。
上周六,在李佳琦预热双十一的直播活动中,阿里语音机器人首次实现与网友见面。直播过程中,有数十万用户同时用语音向李佳琦提问,语音机器人则化身成为李佳琦的影分身,在50毫秒内就完成了语音的识别并用李佳琦的语音合成反馈,处理速度是传统语音的20倍。
在高并发压力下保持迅速响应,这是云原生技术的加成结果。未来的双 11 绝不仅是购物节,主播与用户的互动环节占比将越来越大,AI 语音与视频技术的应用得越来越广泛,云原生技术恰好是应对这一趋势的神器。
云原生是云计算时代的新的团队文化,新的技术架构,和新的工程方式。遵循敏捷的研发原则,使用高度自动化的研发工具,开发专门基于并部署在云基础设施上的应用,以满足快速变化的客户需求。这些应用采用自动化、可扩展和高可用的架构。阿里研发团队通过高效的云计算现网的运维来提供这一应用服务,根据线上反馈对服务进行不断地改进。在容器、DevOPS 等云原生技术栈中阿里技术优势强劲。因此,鲁肃称在 2020 年的双 11 完成全球最大规模的云原生实践。
以下是对云原生技术的解读: 
容器:在 Forrester 首个企业级公有云容器报告中,阿里位于Strong Performers 象限,IBM 也在这一象限。在云原生方面,阿里排在国内第一,离第一梯队的领导者象限相差不远。
DevOps:据 IDC 发布《IDCMarketScape:中国 DevOps 云服务市场 2019 厂商评估》报告,阿里位于领导者象限,战略维度第一。同时在 DevOps 开发运维一体化上,我国企业占据了绝大部分名额,领跑 DevOps 市场。

双 11 背后的技术盛宴

除了云原生“内功心法”外,真正支持双 11 大量并发的还需要具体的武功“秘籍”。我们来盘点下阿里有哪些利器?
数据库——交易处理的核心引擎:前不久,阿里自研的 OceanBase 再次刷榜拿下 TPC 冠军,处理峰值达到 7 亿次/秒,将自己去年创造的 6100 万次/秒提高 11 倍,OceanBase 强大的性能是天猫扛住双 11 史上最大规模的流量洪峰——每秒 58.3 万笔的关键支柱。
一个秒杀系统中有负载、前端分区库、缓存 Redis、数据库 DB 与消息队列等若干模块组成,全部上云难度非常大的。如果把信息系统比做一个武林高手,如此大的交易量代表他的“刚猛威武”,全面上云代表他“灵动飘逸”。把刚猛和灵活完美结合是高境界。在这样的云系统中,由基础到上层有以下几个技术点值得我们关注。
服务器、调度平台、CDN、消息中间件弹性计算的底座:随着移动终端的日益普及,与之前的秒级高峰不同,今年天猫的高峰延续时间很长一直延续到午夜1点,这要求电商平台随时应对交易的峰值,服务与云高度平台是应对高峰的算力供应平台,CDN 和消息中间件则是网络流量平台。
神龙服务器:云计算虚拟化层的损耗是难以避免的,神龙云服务器最大的特点是把虚拟化层的损耗几乎降低为零。随着物理服务数量的增多,性能不打折,这其中最大功臣是阿里自研的 MOC 芯片,MOC 是专门用于虚拟化层的调度服务,将宝贵的 CPU 与内存资源由复杂的云调度中解放出来,开创了一种新型的云服务器形式。
神龙能与阿里云产品家族中其他计算产品无缝对接。比如存储、网络、数据库等产品,完全兼容 ECS 云服务器实例的镜像系统,可以自由地在普通 ECS 实例以及神龙云服务器实例间变配,从而更多元化地结合客户业务场景进行资源构建。
飞天云操作系统飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计算操作系统。据说阿里研制飞天之初有着与 Hadoop 等开源平台的 5k 之争,即哪个集群能先调度 5000 个节点就算胜出。目前飞天操作已具备将百万级服务器连成一台超级计算机,还能有条不紊地通过云计算向用户提供计算能力。
在飞天的基础公共模块之上,有两个最核心的服务,一个是盘古,另一个是伏羲。盘古是存储管理服务,伏羲是资源调度服务,飞天内核之上应用的存储和资源的分配都是由盘古和伏羲管理。其与普遍 PC 操作系统的区别对比见下图:
飞天最底层是遍布全球的几十个数据中心,成百上千万台服务器,把这么多服务器连成一片变成一个整体,令人叹服。
CDN:内容分发网络,其基本思想就是通过缓存等手段,提供数据传输的稳定性,使内容分发更快更稳定,IDC 发布的《中国 CDN 服务 2018 年市场份额报告显示,阿里云位于第二。阿里云 CDN 在全球实现六大洲覆盖,拥有2500+ 节点,覆盖70 多个国家和地区,是目前国内节点数最多的云 CDN。
RocketMQ:阿里自研的开源消息队列已成为 Apache 基金会的明星项目。作为高并发系统的核心组件之一,TA 帮助业务系统解构提升开发效率和系统稳定性。其最主要功能就是削峰填谷与系统解耦。
相比于其它如 RabbitMQ、Kafka 等产品,RocketMQ 最主要的优点是支持事务型消息既消息发送和DB操作双方的最终一致性;在 consumer 端支持 tag过滤,减少不必要的网络传输。其架构图如下:
脉冲式的交易量冲击是非常不利于发挥数据库最高性能的,RocketMQ 消息队列,在秒杀系统最主要的作用就是将交易流量进行削峰平谷,使得 OceanBase 等数据库产品构成的核心系统的负载量,能稳定在一个相对比较平均的水平,为核心系统保驾护航,为客户提供稳定的服务。
通过这次双十一技术大盘点,阿里再次通过自研技术证明了自身在云计算领域的技术领导力。相信疫情带来的线上化趋势会为云计算产业增加强劲的动力,使产业迎来新一轮的快速增长。我国厂商在云计算方面的技术储备相当雄厚,如阿里云自主研发的飞天操作系统、OceanBase 数据库等基础软件就开创了 IT 科技自主掌控的潮流。随着云计算产业二次启动的大势所趋,新基建建设加快,能有效地帮助相关产业后疫情时代的云转型,尽快走出疫情的阴霾。

更多精彩推荐

美团应届生年薪达 35 万?究竟什么导致薪资倒挂?

参与开源项目,结识技术大牛!CSDN “开源加速器计划”招募志愿者啦!

天猫、京东双十一总交易额7697亿元;苹果测试可折叠iPhone显示屏,或将于2022年问世;.NET 5.0发布|极客头条

NLP实战:利用Python理解、分析和生成文本 | 赠书

打钱!我的数据库被黑客勒索了!

对区块链撒谎:将“垃圾进,垃圾出”问题应用在去中心化网络上

点分享
点点赞
点在看

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接