在科技成为生产力的时代,我们就常被一个关键词所围绕:“颠覆”。这个词充斥在各种各样的技术创新和模式创新当中,可是什么样的技术真的值得被冠以“颠覆”之名?
实际上,颠覆应该具有几个维度的特征。比如,它是否对原有的技术架构有根深蒂固的改变?并符合时代的特征;它是否基于完全自主的技术研发能力,而不是舶来品;同时,它在技术细节上是否能够解决“历史性”的行业难题?
那么,从数据中心的角度看,云显然是过去乃至现阶段最具颠覆性的技术,而未来最颠覆性的技术应该是AI。
AI时代已经到来,AI正在以前所未有的速度深刻改变人类社会生活,改变世界。人脸识别,无人驾驶,智能推荐等AI应用已经成为现实。越来越多的企业将AI视为数字化转型的下一站,利用AI助力决策、重塑商业模式与生态系统、重建客户体验的能力将是数字化转型计划取得成功的关键推动力。-项世界
但数据中心的三大要素,计算、存储和网络,却在智能化演进速度上有明显的差异,随着存储介质和计算能力的大幅提升,在AI时代的数据中心集群中,网络面临智能化升级的新挑战。
全面智能,网络无法缺席
人工智能正在以超出我们预想的速度发展。"数据、算力和算法是支撑今天人工智能走向成熟的三大重要力量。
同时,AI与数据中心也是相辅相成的关系:数据中心为AI提供更多的技术支撑与创造无限可能,AI也给数据中心带来巨大的利益。换言之,AI的发展需要数据中心,而数据中心的发展也将离不开AI。
不可否认,今天的数据中心行业发展正面临前所未有的复杂环境,网络应用种类和数量的极大丰富催生了海量数据,据IDC预测10年增长达到20倍以上,到2025年达到180ZB。同时这些数据中非结构化数据占比持续提高,未来将达到95%以上。-华为再
如此庞大的数据量和处理难度已远超人类的处理能力。这说明我们需要基于机器运算深度学习的AI算法来完成海量无效数据的筛选和有用信息的自动重组,提供高效的决策建议和智慧化的行为指引。
事实上,在数据中心智能化的过程中,AI驱动的计算、存储和网络的自动化优化和智慧运营以及AI驱动的巡检机器人等,都是当前的智能化数据中心正在面临的新需求、新挑战。
为了加速AI的运行效率,数据中心的存储和计算领域也已经发生了巨大的技术变革。比如,存储介质从机械硬盘(HDD)演进到闪存盘(SSD),来满足数据的实时存取要求,介质时延降低了不止100倍;为了满足数据高效计算的诉求,业界已经在采用GPU甚至专用的AI芯片,处理数据的能力提升了100倍以上。-项世界
而以基于意图的网络为代表的网络智能化技术,也早在2015年就被Gartner看作是未来的趋势。2018年,华为也首次发布意图驱动的智简网络(IDN)解决方案。应该说未来的智能数据中心,就是智能计算、智能存储和智能网络并存的全面智能时代。-华为再
业界首款AI数据中心交换机诞生记
正是基于数据中心智能网络的认知,华为发布了业界首款面向AI时代的数据中心交换机CloudEngine 16800。
胡克文表示,华为希望将人工智能技术注入到网络产品和解决方案中,构建一个“自动驾驶”的网络,使网络的利用率和运维效率倍增,同时将“+ 智能”的网络提供给各行各业,帮助客户加速AI业务的运行,为AI应用持续创新提供土壤。同时他认为,“AI时代的数据中心交换机具有三大特征:内嵌AI芯片、单槽48 x 400GE、以及向自动驾驶网络演进的能力。”-项世界
怎么来理解业界首款AI数据中心交换机诞生的意义?我认为应该有三个关键。
第一是算力提升。因为AI存在的价值就在于高效,尤其在大量的AI应用出现之后,庞大的数据量和计算力需求背后,如何通过AI算力的提升来保证效率?
那么,华为承载独创的iLossLess智能无损交换算法,能够对全网流量进行实时的学习训练,并根据不同业务流量模型的特点动态设置最优的网络参数,更精准地控制流量,实现百万流和基于应用的队列自适应不同场景的全局网络自优化能力,保证数据中心网络在传输无丢包基础上达到最高的吞吐量,这样的智能无损数据中心网络克服传统以太网丢包导致的算力损失,将AI算力从50%提升到100%。-华为再
第二是智能化的运维。数据中心网络的运维一直是个大问题,通常业务出问题,都会先找网络的问题,所以主动式的智能化运维对数据中心全面智能化,是一个关键。
而CloudEngine 16800 基于内置的AI芯片,可大幅度提升“网络边缘”即设备级的智能化水平,使得交换机具备本地推理和实时快速决策的能力。通过本地智能结合集中的FabricInsight网络分析器提供分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位,使能自动驾驶网络加速到来;同时,基于分布式的AI运维架构,可大幅提升运维系统的灵活性和可部署性。-项世界
我们常把AI比喻成“无人驾驶”,而实现了自动化运维,做到自愈的网络才称得上是“无人驾驶”的网络。
第三是高性能。数据中心的基础设施建设往往要考虑未来的需求,比如100G服务器的商用比业界预测的时间提前了三年,200G服务器也预计将在2-3年后出现,届时用户对数据中心网络的带宽需求将剧增至800G。怎么去保证网络满足未来的高性能?-华为再
所以,CloudEngine 16800成为了业界首个单机提供768个端口的400GE交换机。交换能力高达业界平均的5倍,满足AI时代流量倍增需求。同时,单比特功耗下降50%。
“万物互联的智能世界正加速到来,数据中心正成为5G、人工智能等新型基础设施的核心。华为率先将AI技术引入数据中心交换机,引领数据中心网络从云时代迈入AI时代。”胡克文说。
走进智能时代,华为为什么总是引领者?
从2012年8月8日,华为面向云计算时代发布CloudEngine 12800数据中心交换机,正式进入了数据中心网络领域时算起,华为在这条路上已经走过了6年多的时间。
华为就是这样一家公司,只要选定了目标,必然全力以赴,注定不会做行业的跟随者,而要做领导者。
所以,当时的CE12800交换机领先的架构,就引领了高密100G平台数据中心交换机的设计潮流。其正交架构、前后风道、面板进风等领先设计理念被业界后续推出的数据中心交换机争相模仿。
在之后的六年多的周期当中,华为数据中心网络解决方案销售收入连续6年高速增长,根据IDC的报告,从2016年开始已经国内份额稳居第一;全球厂商增速横向评比,2013~2017年复合增长率第一,增长速度大幅领先第二名的2倍以上。过去几年来华为数据中心网络解决方案是数据中心网络市场上当之无愧挑战者,同时在最新的SDN方向,2018年初已经被Forrester评为领导者,进入2018 Forrester Wave领导者象限。-项世界
这一系列的成绩背后,一方面是华为的前瞻性,比如在AI领域,华为几年前就发布了智能世界的远景,在今年,华为又将人工智能定位为新的通用技术,并发布了人工智能发展战略,全面将人工智能技术引入到智能终端、云和网络等各个领域。所以,CloudEngine 16800交换机的出现就变得特别顺理成章。-华为再
另一方面则是华为从投入之初,就涉足底层核心技术,比如核心交换机CE16800内嵌AI芯片,提供超强、充裕、经济的算力;而接入交换机CE8861、CE8850,CE6865等接入层设备内嵌专用网络智能芯片,这些芯片级的技术是华为能够持续做行业引领者的底气。-项世界
华为交换机与企业网关产品线总裁钟开生告诉我,“数据中心网络的AI化演进,最大的好处就是让普惠AI的实现更近了一点,这是华为一直以来秉持的理念与构想。”
不难发现,从起初的数据中心云化,再到今天的数据中心网络智能化,华为从不是AI概念的搬运工,而是实实在在的核心技术的创造者,所以建造在这种底座上的产品和解决方案,才做到了务实,做到了适用,真正向AI能力普惠迈出了重要的一步。-华为再