摩尔定律失效,未来三十年看“算力三定律”

百家 作者:IT时报 2022-07-19 16:57:37

摄影:IT时报  郝俊慧

数字经济正进入新发展阶段。


根据中国信息通信研究院发布的《中国数字经济发展报告(2022年)》,2021年,我国数字经济发展取得新突破,数字经济规模达到45.5万亿元,同比名义增长16.2%,高于同期GDP名义增速3.4个百分点,占GDP比重已达39.8%。数字经济正在成为重组要素资源、重塑经济结构的关键力量。


进入2022年以来,各省市区纷纷发布数字经济“十四五”规划,其中共同的关键词无疑是“算力”,作为数字时代的核心资源,以算力为核心的数字信息基础设施建设被提到前所未有的高度。


然而,究竟什么是算力?什么是算力网络?AI和算力的关系如何?双碳和算力是对立还是互补?站在奔涌而来的算力时代门口,太多困惑需要科普和深度探讨。


或许,在今年5月17日中信出版集团出版的新书《云网融合—算力时代的数字信息基础设施》(以下简称《云网融合》)中,许多问题可以找到答案。


本书的作者是刚刚退休的中国电信集团有限公司原总经理李正茂、中国电信股份有限公司研究院网络技术研究所副所长雷波等研究人员,书中创新性地提出了“算力三定律”概念,即时代定律、增长定律和经济定律,并以此为主线,剖析了新时代新模式下的算力应用、算力体系和算力趋势。


“作为国内算力网络产业最早的实践者和倡导者之一,本书作者对算力资源与云网设施的结合有独到见解。”中国科学院院士尹浩在为本书写的推荐序言中如是表示。


2021年7月,本书作者之一雷波带领的研究团队,推动国际电信联盟电信标准化部门(ITU-T)开启了Y.2500系列编号,形成了以中国电信牵头的算力网络框架和架构(Y.2501)为首个标准的算力网络系列标准。


 不久前,《IT时报》记者专访雷波,为广大读者详解何为“算力,就是生产力”。

关于算力三定律

算力概念这几年很流行,但对于什么是算力,还是有很多认知盲区。《云网融合》一书中对算力的发展演变和广义狭义的概念都做了详细阐释。


书中首先澄清一点,算力并非工业化和数字化时代的特有产物,实际上不同历史阶段都存在算力,比如公元前3000年的结绳计算、中国古代的算盘、19世纪使用齿轮等复杂机械装置的机械计算器以及以电脑、手机为代表的数字化算力,即基于集成电路的算力。


但这并非算力的所有,随着技术的持续演进,算力开始有了更为广义的概念。根据中国信息通信研究院提出的“算力规模、算力环境和算力应用”算力体系,算力规模指基础算力、智能算力和超算算力,算力环境指网络环境(带宽、覆盖率等)和算力投入,算力应用指消费应用和行业应用水平。


基于以上概念,书中独创性地提出了“算力三定律”,其中第一定律(时代定律),算力就是生产力;第二定律(增长定律),全球算力规模约每 12 个月增长 1 倍;第三定律(经济定律),算力每投入 1 元,将平均带动 3~4 元GDP增长。

《IT时报》:书中认为,从现在到2050年,算力的发展将呈现三定律,然而,照此前科技发展的速度来看,三十年或许会发生很多事。您认为三定律在这三十年中,会发生怎样的变化?

雷波:智能算力的增速将远超总体算力,根据信通院预测,到2023年,智能算力在总算力中的比重将超过70%,发挥核心拉动作用。


这个过程必将伴随着人工智能在深度和广度上的拓展,不论是当下比较热门的机器人、无人驾驶、智能制造领域,还是关系到人们福祉的日常家居、城市治理、医疗保健,都将打上“智能化”的标签,智能无处不在,算力无处不在。


美国记者纳撒尼尔·波普尔把虚拟货币称作“数字黄金”,其实在算力的不断加持下,会有更多像区块链一样的信息技术,从实验室走向市场,在生活生产各个环节产生重要经济价值。

《IT时报》:如果说算力是生产力,那么,算力会是未来衡量价值的唯一标准吗?

雷波:和历史中的任何阶段相比,当今人们对算力的需求呈现了爆发式增长的局面,这个既定的事实支撑了全球信息产业的飞速发展。算力作为数字经济的底层运转逻辑,被赋予极高的战略意义,在未来很长一段时间内,算力将作为重要生产力在各行各业发挥作用。


同时,多元化是世界的发展现状和未来,以人的劳动为代表的人力时代、以畜牧业为主的畜力时代、以机器设备为代表的动力时代,再到现在的算力时代,历史上任何阶段的出现都以生产力发展为前提,算力是算力时代的标志,是支撑数字经济、数字社会、数字政府的技术底座,是衡量价值重要但并不唯一的标准。

《IT时报》:未来,算力会造成新的不平等吗?

雷波:2018年的时候,谷歌就曾发布过一个叫做BigGAN的图像生成器,它一度被冠名为史上最佳 GAN。


人们无法分辨出由 BigGAN模型生成出来的图片和真实照片之间的区别。当时大家都认为是人工智能算法太强大了,但在接受媒体采访时,算法的作者表示模型成功的关键不在于算法的改进,而是算力的进步。因为训练 BigGAN 模型生成一个 512×512 像素的图像需要用到 512 块谷歌TPU,并且训练时间要持续 24 至 48 小时。


所以,人工智能的进步需要以充足的算力为前提。与此同时,大算力又提高了人工智能的准入门槛,只有具备资金实力的企业才能支付高昂的算力成本,小企业从核心赛道逐渐剥离。


不过,东数西算战略、中国电信的云网融合等,都在致力于推动算力的公共化、普惠化和标准化,基于算力之上的AI技术将给各行各业创造平等的发展机会。

《IT时报》:书中提到,算力在未来建设和运行元宇宙过程中扮演着至关重要的角色,但同时也提到,如果按照沉浸式要求设计元宇宙,消耗的电量和算力都是惊人的。那么双碳和算力之间存在矛盾吗?这个问题会成为最后元宇宙形成的障碍吗?

雷波:双碳和算力的关系要一分为二地看。


首先从数字经济的角度,在全球经济陷入下行危机的情况下,数字经济能实现逆势增长,其背后的主要动力就是算力的倍增效应,满足算力需求将有助于更好地发展包括节能减排在内的先进技术,赋能经济社会高质量发展。


从能源角度讲,不可否认,算力的增加势必伴随着能源的消耗。2016年,AlphaGo击败围棋冠军李世石的人机大战中,AlphaGo每局棋需消耗约100万瓦的电能。相比之下,人脑消耗的功率仅20瓦,只有AlphaGo的5万分之一;一个拥有5000机架的中小规模数据中心,其用电量和4万多户家庭的用电量基本持平。


但有数据表明,2010年以来,全球数据中心总功耗增加6%,但全球总算力提升了550%。这意味着算力和能耗不是简单的正比关系,尤其是这几年,在双碳目标的要求下,“高效、低碳、集约、循环”成为数据中心关注的焦点,水冷离心式空调系统、余热回收技术、间接蒸发冷却技术等先进绿色技术,在数据中心环境中频频出现。例如中国电信在海南开发的海底数据中心项目,将数据舱安放在海底,利用海水资源进行冷却,空调系统全年海水自然冷却,整个系统几乎无淡水资源消耗。


目前国家实施的东数西算工程本质上也是改善算力碳排放量的重要举措。相信随着政策和技术的逐步落地,双碳和算力会达到相互成就、共生共荣的局面。

关于算力网络

自从2019年算力网络的概念被提出以来,在学术界和产业相关方引起了广泛的关注。“不同算力节点之间如何高效协同”“人工智能如何加速算力发展”“如何应对算力面临的低碳与安全挑战”等成为热门话题。


何为算力网络?书中提出,由于算力资源分布在网络的各个位置上,且归属于不同运营方,因此将算力资源信息与网络资源信息有机结合起来,将算力连接成网状化的供给模式,便是算力网络化的方向。


简而言之,需要将分布式、多级的算力通过网络进行整合,并结合人工智能、安全、绿色等技术,赋能算力产业的多样化发展,使其像电、水等基础能源一样按需、按量灵活供给,满足业务大算力、低时延、高移动性、潮汐性算力需求,为新兴业务提供共享、绿色、智能、可信的算力服务。


2021年9月,ITU发布由中国电信牵头的国际标准Y2501,即算力网络框架与架构标准,这是首个算力网络国际标准。

《IT时报》:据了解,无论是中国电信还是中国移动,都在全国部署算力网络,尤其是中国电信,基于雄厚的底蕴,在全国部署了完整的算力体系。但这些“2+31+X”算力池,如何能在一张网上进行调度?距离全网算力随心所欲,最大的挑战在哪里?

雷波:传统的网络和算力资源具有相互独立性,在面对一些新兴业务中复杂的多层次化资源使用诉求存在一定的差距。


首先是资源弹性选择,在算力体系中,包括云边端在内的多级算力节点,其地理位置和归属方各不相同,短期内很难通过集中式的管控编排系统,将这些资源统一分配与配置优化,且运营主体也存在不确定性因素。


其次是高效传送需求,例如东数西算要将海量数据需要从东部城市传送到西部计算节点,还需要将计算结果再传回东部城市,既有高带宽低成本的传送通道需求,也存在低时延、低抖动的确定性网络连接需求。


最后是超融合发展,如何将计算、存储、网络等多维度资源融合供给,是数据中心甚至算网体系亟待解决的难题。


算力网络技术可以基于异构多级资源,扩展传统网络路由能力,达到整合泛在的算力资源的目的,从而实现算力在供需各方之间的自由流动。

《IT时报》:由于算力本身的复杂性,算力度量成为算力网络中一个亟待突破的技术难点,书中给出三种计算方案,能详细解释一下吗?

雷波:算力度量是算力网络运行的第一步,但没有统一的算力单位并不会给算力网络技术的发展和研究带来决定性的阻力,针对算力及算力资源的特点,书中给出三种方案可以实现算力的度量。


第一种,根据不同场景对不同的算力进行度量,例如在人工智能场景,神经网络计算能力>逻辑计算能力>并行计算能力。不同的服务器根据其所含芯片的类型及数量,计算其算力大小。


该种方法比较公平,可以评价出每种算力资源在不同场景中所能发挥计算能力的大小,但是该种方法比较复杂,因为涉及场景比较多,所以一种算力资源会对应不同的算力值,会增加后续算力路由、算力交易的复杂程度。


第二种,按照建造成本为不同的计算能力定义固定比例的系数,例如 a*神经计算能力=b*逻辑计算能力=c*并行计算能力,通过该系数计算每种算力资源所对应的计算能力。


该种方法可以使每种算力资源对应唯一的算力大小,可以为后续的算力路由和算力交易提供统一的算力信息,但不够公平,具有场景偏向性,会造成在某种场景下,算力大的算力资源其实际运行效率,低于算力小的算力资源。


第三种是选取特定的计量单位,如内核数、虚机数、容器数等


该方案相对于第二种方案更加简单,但颗粒度也更加大,一个算力资源的算力大小和它在实际使用时发挥出的性能匹配度会降低。


这三种方案都具有各自的优势与不足,可以根据算力网络的研究方向与研究进度采取不同的度量方案。相信随着算力度量技术研究的深入,还会提出更多更加完善的算力度量方案,更好地支撑算力网络技术的落地部署。

《IT时报》:据了解,2021年,您的研究团队推动 ITU 开启了 Y.2500 系列编号,已经形成了以中国电信牵头的算力网络框架与架构(Y.2501)为首个标准的算力网络系列标准。为什么ITU会将这项工作给到中国?

雷波:标准化是技术从构想走向落地的重要支撑,在技术产业的推动中发挥着基础性、引领性的作用。


首先,算力网络的用户无须关心算力、存储各类基础资源的位置和部署状态,通过网络即可协同调度各类资源,保证用户的一致体验;其次,算力网络技术支持基于用户的服务等级协议SLA需求,综合考虑实时的网络、算力、存储等多维资源状况,通过网络灵活匹配与动态调度,将业务流量调度至最优资源节点,实现服务灵活动态部署。


Y.2501正是基于此背景,提出了算力网络的框架与架构,得到了各方专家的认可和大力支持。


这个过程中也出现一些质疑和挑战,主要是由于国内外运营环境的不同,尤其是在国内边缘计算领域发展速度更为迅猛,所面临的业务需求也不完全一致,导致国外专家对算力网络的必要性存在争议,后来经过多轮讨论,国外专家逐渐接受了相关理念。

《IT时报》:回到本书的题目上,“云网融合”的一体化运营不仅是通信技术的产业升级,更代表了新生态、新机遇,算力网络的参与者也更加多元。您觉得电信运营商在这场算力革命中的优势是什么?

雷波:云网融合是智能化综合性数字信息基础设施的核心特征,作为我国信息通信领域的主力军和国家队,中国电信在2020年发布的《云网融合2030技术白皮书》中,明确提出“网是基础、云为核心、网随云动、云网一体”的16字发展原则。


东数西算就是典型的云网融合工程。在推进云网融合的过程中,电信运营商有独到的优势和条件。第一,网络层面,三家运营商网络是世界上规模最大的;第二,要有丰富的数据中心资源,据统计,电信运营商的数据中心资源占全行业40%以上;第三,电信运营商有海量的数据以及多年来面向客户的运营经验和运营队伍。

作者/IT时报记者   郝俊慧

编辑/ 挨踢妹 

排版/ 季嘉颖

图片/ IT时报

来源/《IT时报》公众号vittimes

大家都在看

点「在看」并「留言」,谈谈你的看法


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接