【SDN茶话会】深圳站:详解数据中心网络的未来

SDN in China

2018年6月7日

技术探讨

【深圳】5月24日的深圳溽热难耐,深圳大学对面平时幽静的德迹斋挤满了华南网络界的精英,来自招商局金融科技、中国移动南方基地、顺丰科技、华润集团、万科集团、唯品会等领军企业的网络大佬们聚在这里,大家围绕SDN技术落地和应用价值,共同开启华南地区SDN用户价值的讨论。

云杉网络CEO亓亚烜在致辞时表示,SDN的市场以前是看不明白、现在大家终于都能看明白了——最大的动力来自客户。这也是云杉网络举办SDN茶话会的初心。

不少人带着诸如在企业网络中如何实现4~7层的自动化和可视化,以及怎样保证高可用和安全性;如何看待SDN与白盒的关系;当前状态下运营商如何才能跟随市场节奏进行网络的升级与转型、传统设备供应商应该在哪些产品或技术上努力、IBN目前在技术和应用方面的进展与现状是什么等问题来到了现场。

SDN在数据中心的价值之体系建设

▌平安云的SDN/NFV实践

image7

平安云是国内首家面向金融垂直行业的云计算平台,沉淀平安集团在金融行业的业务优势及金融IT领域的技术积累,拥有三地六中心的布局,提供了高可靠、高弹性的计算能力及量身定制的金融行业解决方案。目前,平安云规模在10万虚拟机量级,针对保险、银行、投资、证券、互联网金融等不同金融业务场景提供针对性的垂直解决方案,满足了新的市场环境和多元化的金融需求。除了支撑现有的集团业务外,在健康和金融行业也提供对外服务,同时在做智慧城市的解决方案输出。作为金融云,平安云承载了众多核心的业务。

公有云和主机Overlay是未来

众所周知,金融行业的安全控制比较严格。平安云网络总监陈书浩从平安云的建设讲起,详细描述了平安云网络中NSP、Fabric和NFV的建设历程。NSP承担了北向网络服务API支撑、NFV生命周期管理、多厂商设备接入、与监控和日志平台等运维后台对接等职能。通过网络核心组件NSP,平安云对外提供了诸如精确计量、分布式防火墙等强大的网络服务。在VPC 1.0到VPC 3.0建设过程中,无论是技术选型还是其中的经验教训,他知无不言、言无不尽。

image6

最后,陈书浩认为SDN已经广泛应用到客户网络中,来自业务的需求才是促进SDN发展的关键因素。架构方面,主机Overlay更灵活,公有云的趋势是未来。从手动配置网络策略,到自动化的业务编排,慢慢去实践就能发挥SDN的功能和价值。

▌为什么要「看见」云网络流量

image8

云环境中常见的困扰类似手机的身份和位置之谜,我们知道手机的IMEI串号是唯一的,但这台手机的IP地址却随着所处网络环境的变化而变化。云杉网络研发总监向阳从「看见」云网络流量这个话题展开,回顾了云环境中常见的计量困扰、排障困难和安全问题等,从监控分析的角度提出了对云环境网络流量从看见到控制的闭环逻辑和实现。

从Hack内核到影子交换机

拿到并“看见”物理网络、虚拟网络的流量数据依然是解决问题的第一步。向阳对比了云杉网络DeepFlow®虚拟网络采集器三代技术的演进,第一代技术是需要修改内核、对业务有干扰,第二代技术采用虚拟机形式、系统开销大且对业务策略有干扰,第三代影子交换机已经实现零依赖、无干扰、低消耗、易管理。随着客户业务网络的变革,云杉网络DeepFlow®虚拟网络采集器的技术也在不断迭代,并满足绝大多数场景。

image3

随后,向阳分别从计量、排障、安全、基于行为的异常流量分析等场景介绍了DeepFlow®的实际应用。并指出,流量的本地化处理正在成为趋势,这不但是技术的发展使然,更是业务的发展使然。

SDN在数据中心的价值之运维智能化

▌公有云网络的运维之困

image4

腾讯云网络产品中心专家工程师王营从公有云视角讲述了腾讯云网络发展的三个阶段。随着腾讯云规模的增长,对网络的挑战越来越大,如何保障业务热迁移等一系列问题摆在了网络团队的面前。

腾讯云网络的发展经历了三个重要的阶段。从最初的传统三层网络向Overlay的大二层网络发展中,腾讯云对网络的要求是,数据平面要稳定,不同的网关承载不同的业务流量;控制平面要规模,单集群支持百万级的VPC、数十万宿主机、并且能经过实践检验。

腾讯云数据中心的两张网

腾讯云的数据中心主要建设了两张网,分别是内网网络(包括数据中心内的互联,主要考虑宿主机、网关和支撑三个专区的划分)和外网网络(数据中心之间的互联)。其数据中心网络通过DPDK和智能网卡的改造,网络转发性能提升了10倍。最终实现连接腾讯云全球数据中心的TB级云企业网。

image5

最后王营展望了腾讯云网络未来的BGP就近接入和边缘计算,并从网络规划、资源管理、网络监控、故障定位与排查、安全防护等方面阐释了超大规模网络运维智能化的趋势。

▌DevOps与网络运维自动化

image2

来自Arista大中华区的技术总监&首席方案架构师池惠澄分享了网络运维智能化的探讨。他表示很多灵活的网络控制都选择在主机OVS上实现,这是一个主流趋势。回顾20年前的运维工作全靠手工操作,现在DevOps的工具让自动化成为主流。几乎所有的企业都在思考这个问题,如何集中化、自动化地管理网络?

像管理服务器一样管理网络

Arista帮助很多大型互联网公司、金融企业部署了DCI的网络。其最新部署的Facebook瑞典数据中心高达10W台服务器。如此大的集群,怎样像部署服务器一样部署网络设备?部署好的网络该怎么管理?这将给其他企业提供可参考的建设经验。

image1

在Arista看来,现在的网络设备是集成多个高性能网卡的服务器。除了CLI还有Bash都可以带你进入熟悉的服务器管理界面,既然能像服务器一样管理,各种扩展软件也可以很方便地安装和使用。如果善加利用设备所提供的rest API,我们就能将人机交互变成机器与机器交互,从而解放生产力,例如实现全网模块化一键部署。

网络监控黑盒的可视化正在从传统的抽样「SNMP轮询」到基于事件的主动推送。搭配后端稳定和成熟的分析系统,云网络的可视化将不再是障碍。

uuuu

Related Posts

「直播回看」高清云网可观测之全链路追踪实战

“云原生可观测性分享会”第七期《高清云网可观测之全链路追踪实战》由云杉网络 高级产品经理 李倩分享,针对云网络的全链路追踪问题,用「实战」带领大家一步一步破解“网络谜案”。

Read More

「直播回看」MetaFlow:开源的高度自动化可观测性平台

今天非常高兴能给大家带来一个好消息,云杉网络正式宣布开源MetaFlow,一个高度自动化的可观测性平台。这是云杉网络从2016年以来,商业化产品DeepFlow从云网络发展到云原生应用持续积累的结果。MetaFlow包含了我们在可观测性建设中核心的关键技术,今天正式开源并共享给社区,为可观测性发展共同建设出一份力,同时也向世界领先的目标往前迈进一步。

Read More