云杉网络亓亚烜:SDN是一场安静的革命

SDN in China

2017年11月20日

媒体报道

引言:本文系至顶网对云杉网络CEO亓亚烜的采访内容,将分两篇向大家展示。访谈中我们追溯了传统网络的问题、分析了当今网络的现状,并进而展望了未来网络的发展。请持续关注云杉公众号,我们将在近期更新全文。主持人:ZD至顶网的网友大家好,今天我们讨论的话题是关于SDN和相关产业的发展问题。大家都知道SDN概念从被提出到今天,经历十多年的时间,在这十多年里,从一开始的概念炒作到后来相关领域、厂商纷纷尝试SDN技术,再到目前许多企业和用户逐渐开始在生产网络中应用SDN技术。在这个历程中,我们发现SDN本身给传统网络带来了新问题,基于这样的初衷我们作为媒体一直想跟相关SDN厂商一起做一场探讨。媒体更关注SDN现阶段还有未来会遇到哪些新问题,而今天我们有幸请到了国内著名SDN企业云杉网络首席执行官兼创始人亓亚烜,作客ZD至顶网直播间,为广大网友分享在云杉网络眼中SDN是什么样的。

Q:下面就正式开始我们今天的话题,我想问亓总的第一个问题是,云杉网络作为国内最早进入SDN领域的企业,您对SDN现阶段整体产业发展是持什么样的看法?

现在的阶段其实属于基础已经打好了,怎么在上面创造价值的时代。

我们团队做SDN前后差不多十年了,回到初衷,最早为什么要做SDN?是因为网络这个行业在SDN出来之前它已是越来越复杂,让很多网络工程师日以继夜去学习新协议、学习新设备。但是,网络的问题似乎又层出不穷。SDN出来后,用一种全新的架构改变了这种现象,让真正使用网络的人变得很简单,也让网络变得畅通。

它的方法不是靠协议来解决问题,而是用软件。所以最早2006年提出了Open  Networking「开放网络」,前3年基本上都是学术界在研究,刚好那时候我在清华大学也在从事相关的研究。到了2009~2012年,这是第一个SDN产业化的3年,那时候可以说叫的名字非常响,有很多投资投入进去,也涌现出了一大批SDN创业公司。但是那个时候SDN虽然离生产还非常非常远,不过已经有人在用了,比如说Google、微软在用SDN的解决方案。

到了2012~2015年这3年,可以看到大量的SDN公司被收购,同时不管是软件厂商还有硬件厂商都推出比较成熟的SDN的解决方案,例如思科、VMware等等,这个阶段是SDN第二个阶段,已经有了SDN的产品,或者网络已经可以被SDN、可以进行细粒度调度和软件控制。

紧接着到2016年以后,我们发现这么一个问题,当网络可以被细粒度控制调度,当网络的管道、网络上的各种防火墙都可以去编排控制的时候,反倒使用网络的人变得更迷茫了,我如何去编排?如何去控制?以前我对着网络就是配置它一些功能,让网络能够连通就行了。现在要通过这种细粒度的配置让网络能够承载云计算的业务,让网络能够不断扩展,似乎变得更复杂了,因为SDN带来太多灵活性。

所以,现在的阶段其实属于基础已经打好,怎么在上面创造价值的时代。SDN这个词或许没有前几年那么火热,其实SDN的价值才刚刚浮现出来。

Q:亓总分享的观点我们也非常认可,所以我们看到现在SDN已经度过了最初对概念、价值的阐述阶段,现在许多企业已正式开始尝试SDN技术带来的好处。同时,我们也能看到很多传统数据中心、IDC、相关三大运营商,都在积极向云做转型,跟SDN一起给我们现在的网络带来很大的冲击。很多时候我们作为媒体也发现在IT行业中,比如网络运维相关的人员,目前缺口也是越来越大,请问亓总,您怎么看待现在传统IDC在做转型当中对整个行业未来会产生什么影响?包括作为运维人员,网络管理产业未来的发展方向。

不是IDC的转型对行业产生影响,而是IT转型导致了企业必须去转型。运维人员的问题,与其说是运维人员的缺口,其实是解决网络和业务之间的差距。

我觉得根本原因不在于IDC的转型对行业产生影响,其实是各行各业的IT转型导致了这些企业必须去转型。比如:大家都要用云计算了,大家都需要高速网络互联了,这些原因导致IDC不转型已经不行了,光提供资源到提供管道已经不能满足企业现在日益增加的对IT对基础设施的要求。

运维人员的问题,尤其是提供运维人员缺口这一块,从另一个角度来说,这个缺口用英文来说就是「gap」,与其说是运维人员的缺口,不如说是网络与业务的缺口。为什么运维人员原来不缺口或者没那么大的问题,而现在出现这么大的问题,本质原因是因为业务在飞快的变化,网络却没有变化,才导致这个岔口。导致运维人员现在要做更多的事情。做更多的事情时,就出现两种情况:一种是我更高效,一种是我需要更多的人。

所以,要弥补这个缺口,其实就是解决网络和业务之间差距的原因。通过IDC转型解决;通过更多的运维工程师解决;通过SDN解决,这都是方向和路。对运营商来说,当然是通过SDN去解决,通过软件去解决。

Q:刚才说到云杉在现阶段还是倾向基于SDN去解决行业转型在IT方面遇到的问题。我们之前了解到云杉提出过“to cloud”的概念,现在我们看到更多是网络可视化相关的主题。亓总帮我们网友分享一下,当时云杉提出这几个概念是基于什么考虑?

SDN的方案还没有成熟,企业没有标准化的SDN基础设施布局,我们更偏向先从云这个角度切入到客户。

2Cloud是以前云杉混合云的平台,混合云是把不同的资源联系到一起,本质上还是一个网络平台。当时我们为什么要从cloud出发,这个跟我最开始说的“几个3年”有关系。在2012~2015年,云杉主要做“to cloud(2Cloud)”的事情,SDN的方案还没有成熟,企业没有标准化的SDN基础设施布局。那个时候如果直接给客户提供SDN解决方案,在客户哪里很少有适用场景,因为客户才刚刚开始搭建云平台,所以我们先从云这个角度切入客户。

其次,在2Cloud里面用了大量SDN技术,现在云杉的产品DeepFlow就是从这个平台里面孵化出来一个产品,可以说DeepFlow就是2Cloud里的网络管理系统。DeepFlow孵化出来后,可以运行在其他平台,比如OpenStack、VMware,也可以运行在像Bare-metal这种大的环境里面。并且,我们很快会推出运行在公有云环境里,这样的云杉的SDN才是真正的从2Cloud孵化成熟,它的DeepFlow也走向千家万户。

Q:云杉网络的产品在网络运维、网络可视化、云方面有进一步发展,您看目前SDN在整个产业当中除了这些领域,未来还有哪些是需要我们去关注的?

现在我们已经有这样的网络平台了,后面的发展就是看怎么来催生上面的软件体系的发展。

我觉得如果这里面分两部分来说,一方面是站在SDN的角度,现在已经有这么多SDN的平台,比如思科ACI系统、华为AC系统,包括云杉DeepFlow系统,但是现在有多少网络工程师在这些平台上写软件?要通过软件去定义这个平台,前提是网络已经具备软件定义这种能力,但是现在真正在上面写软件的人数还不多。这就好像智能手机出来后,如果上面没有那么多应用,其实这个产业还没有成长起来。

现在我们已经有这样的网络平台了,后面的发展就是看怎么来催生上面的软件体系的发展。而催生网络软件发展那就分几条路了:

云杉是其中一条路,我们走的是一条开放的路,我们让用户在DeepFlow平台上写软件的时候,所有的接口、所有的数据都是开放的。比如我们提供的大数据平台的接口、比如Elasticsearch的接口、Kibana可视化的接口,用户只要懂一点大数据,懂一点基本的数据工具,他就可以在DeepFlow平台上写定义网络的软件了,包括做网络的计费系统、网络安全分析系统,网络「大象流」的优化系统,只需要掌握基础的大数据或者一些可视化工具就可以操作。

有一类厂商也选择另外一条路,他们要自己定义标准,定义自己一系列的API,自己定义自己的数据格式,这个其实跟SDN的初衷有所违背,SDN初衷最早叫Open Network「开放网络」,它的开放能够让更多的人在上面解决问题。反之,虽然你完成了统一控制、虽然你可以编程了,但编程语言必须用你自家的语言。这相当于是功能机,不是智能手机,智能手机是开放的。

我觉得比较庆幸的是,除了像云杉这样的创业公司以外,美国主流的SDN企业,比如BigSwitch已经在全部开放它的接口,包括数据、硬件都开放了。比如Facebook、OCP,它们的开放交换机也完全都是从制造到应用到协议全部开放,用户可以自己去上面编程。

另外,即使像思科这样的公司最近也推出了Tetration,一个大数据分析平台,用来分析网络数据,它的接口是Kafka,是一些通用的接口。这样我觉得整个趋势是朝向开放的,有了这些开放接口才能够让更多的人在上面写软件,有更多的软件产生了,这个行业才在改变。

Q:进一步问一下,现在看来SDN在企业当中不会是一个独立存在的技术,它可能更多是跟现在比较热的云计算、大数据、人工智能这些新技术去做整合。这当中SDN将扮演一个什么样的角色,或者说比如云计算等,对做SDN这样的企业有哪些意义呢?

云计算让业务变得非常的动态,非常的灵活。那么,业务灵活了一定需要网络也灵活。

我们通过业务的视角来看云计算,云计算让业务变得非常的动态、非常的灵活。那么,业务灵活了一定需要网络也灵活,而网络的灵活性需求已经不能靠人来满足了。我随便举个例子,我们的控制器有的时候在1秒钟之内会给某个交换机下1000条指令,这件事如果让人去做是不可能完成的。但是,这个需求是业务需要的,所以SDN对于支撑灵活的云计算业务几乎是一个必备的条件。

当然,SDN还有另外一些事情,在灵活性变得这么强大的情况下,网络基本属性必须稳定和安全。网络就像道路一样,要做输送操作,要把信息从这一点送到那一点去,在这个动态变化性前面还要保证稳定和安全,所以从性能、动态性、稳定和安全方面,我觉得SDN要做的事情还很多很多。

Q:之前我也了解过云杉网络还是比较拥抱像OpenStack这种产业,是不是也是基于开源的理念?

在这个里面大家都说同一种标准的语言,所以我们当然是拥抱这样的。

可以这么认为,OpenStack是一个生态体系,它定义了云怎么跟网络打交道,怎么跟计算打交道,怎么跟存储打交道,在这个里面大家都说同一种标准的语言,所以我们当然是拥抱这样体系。

但是,整个行业走到现在发现包括VMware、AWS云平台都有更多的标准出来了。所以,现在我觉得倒不是说一定是OpenStack。比如最近我们已经开始接触Doker的网络,这里面都是开放的点。网络整个的趋势是在往开放的趋势走。

Q:刚才亓总也谈到了云计算和SDN之间的关系,也谈到了安全,以及访问控制一些相关的话题,所以我们下边就想更进一步问一下亓总,目前我们看到云杉网络可能在网络运维,网络可视化当中做了大量工作,近期我们看到云杉网络推出了DeepFlow相关的SDN产品,请亓总帮我们具体谈一谈云杉推出的DeepFlow产品,它能帮助企业解决哪些问题,里面集合了哪些比较超前的技术?

DeepFlow从名字上看是和Flow技术相关,它的特点是可编程的、细粒度的,DeepFlow让网络分析从以前的管道维度走到了flow维度。

DeepFlow从名字上看是和Flow技术相关。回到SDN的定义,SDN定义是一种架构,是控制与转化分离的架构,它的特点是可编程的、细粒度的,这个粒度细到什么程度呢?细到flow这个程度,在维基百科上定义SDN也是要能够以类似OpenFlow这种的粒度去控制网络。

现在大家在做网络过程中有多少是通过Flow粒度去控制网络的?几乎没有,比如配路由表,通过IP的角度去控制;配防火墙,通过五元组的角度去控制,而且还只是在一条线路上去控制。云杉要做的是全网全流量的每一个端口、每一条线路上的flow粒度的控制,这几乎是2的N次方倍的复杂度,所以需要很多flow相关技术。因为我们最早就在高校、研究院进行了研究,创业后我们做了很多这方面相关算法,如何能够高效识别flow,能够有效控制flow,对网络控制的粒度增加了几个数量级,这是从flow的角度探索这个问题。

至于说你这么细的粒度去控制网络的时候对企业带来什么价值呢?其实我举一个例子大家会比较容易思考,运维有点像诊断或者体检,有点像这个事情,以前诊断是大家面对着一堆交换机,以及交换机上一些日志,一个网络高手去上边配一配、调一调就能把网络问题诊断出来,这非常像老中医把脉的感觉,我从你的表象气色就知道你的数据中心网络哪儿有问题。但是,如果有了flow粒度的大数据分析和统计之后,相当于你对全网可以做透视了,你可以对它里面每一个关节、每一个血管、每一个骨骼都能做清晰的、非常细粒度的、高清的透视,有了这个之后再去发现问题就会变得非常容易,当然这一切都基于在大数据和细粒度的管控之下才能够实现。

所以,DeepFlow这个产品就让网络分析从以前的管道维度走到了flow维度,把分辨率提高到指数次方倍。

Q:所以说DeepFlow这款产品绝对不仅仅是我们一开始理解的SDN定义所能涉及的方面,更多我听到它也有一些云计算,或者大数据分析的技术结合在里面吗?

我觉得它更体现了SDN的价值。SDN定义就叫可编程细粒度,这个是已经把粒度给你编得这么细了,而且每个粒度都是可控的。

首先它确实是SDN。为什么呢,它没有违背任何SDN的定义,它也有控制器,也是控制转发分离的。第二,我觉得它更体现了SDN的价值。SDN定义就叫可编程细粒度,这个是已经把粒度给你编得这么细了,而且每个粒度都是可控的,每一条都在DeepFlow体系下。

传统的SDN就是大家经常说的网络虚拟化,这个东西通常是指对管道的控制,还是比较粗的粒度控制。比如我可以建立一个虚拟管道,我可以让一个网络变成多个网络,这是传统的SDN,这叫网络虚拟化。再做细点是做到网络功能虚拟化,我可以把一个防火墙变多个防火墙,防火墙就要比管道做的事多得多了,它可以做多元组的过滤。到了DeepFlow这个程度我不光对管道,对网络中间的白盒可以做控制,我还可以对整个流量做控制,所以这是把SDN深入到了更细粒度的角度。所以它还是一台SDN的系统。

Q:能把管控做到这么细致,目前在您看来有哪些行业或者企业更适用于我们目前的这款产品,或者更能从中受益,能帮我们分析目前从行业的角度吗?

DeepFlow最早就用在金融上面,我们已经给国内很多大银行去做了。大银行拿这么细的粒度可以做很精细的计量。

其实从行业本身的价值就知道网络的流量价值,随便举个例子,流过一个IDC企业1G的带宽,里边承载的业务价值和流过一个金融数据中心的1G带宽里面承载的业务价值相比,差别很大的。自然在金融行业里需要更细粒度去计量、去可视化、去分析,DeepFlow最早就用在金融上面,我们已经给国内很多大银行去做了。大银行拿这么细的粒度怎么做管控呢?它可以做很精细的计量,因为金融行业的每一个流量上面所带来的业务价值都很高,所以作为运营金融云平台或者金融数据中心的人来说,他需要对不同的业务做不同的计量或者计费,在这里面一个字节都不能算错,算错了损失的都是钱,所以金融行业需要这么细粒度去做。

如果对传统的网络设备做计量,顶多是做一些netflow或者是做一些采样的方式,几百个包采一个包上来做一个大概的,能画一个趋势图、饼图,但如果你拿一个趋势图、饼图去向用户收钱的时候,你的用户会跟你一分一分去算的,所以这里面就是精细的计量。

同时,金融行业里面特别怕有那种欺诈,欺诈的人他的行为往往会在网络上体现出来,但是它会隐藏在网络的洪流之中,所以你需要非常细的粒度把那些可能的欺诈关联起来。比如说我们可以看到有很多的业务是来自同一个海外的IP段,来访问后端的业务,比如说这是个抽奖游戏,或者这是一个金融的活动,这时候这些很可能就是来刷单的,这些刷单的不管他自己刷到了单,还是说它的流量影响到了别人刷单的流量,总之对整个系统都会产生很大的影响,这个东西其实就是业务的问题,网络有了这么精细的东西它可以告诉业务部门说你看这里面已经有这样的问题了。

从安全的角度我们也经历过很多,业务部门快速上线业务,结果中了木马,或者一个业务遭受DDoS攻击的时候,它可能会影响到别的业务,甚至会影响到整个云的正常运行。这个时候如果网络不做到这么细粒度去辨别产生云或者整个全网性能抖动,或者不稳定的根本原因在哪,它只能解决当前的问题。

我前两天刚从一个非常大的金融集团里面出来,他们就是用了国内某著名厂商的一套SDN的环境,但是这套环境出现了一个大问题,它的核心交换机工作不正常,重启了一次,这个事导致他们当时正在整个集团里领导播报的时候出现问题,这时候影响非常大,他就把这个厂商叫过来。其实我觉得对于厂商来说是挺无辜的一件事情,因为这件重启很可能不是它设备自己的问题,很可能是业务的流量冲击,或者说是某些配置上的不正确,但是在场没有一个人能够拿出数据来说它的根本原因在哪。

如果用了DeepFlow这样的系统,我们就去帮他们解决这个问题,我们可以把它过去很长时间整个网络里面流量的情况都看清楚,这时候可以清楚到底是谁触发了这件事,精准到哪台机器,这样才能够把那台机器抓出来解决问题,确保以后不再出现同样问题。

因为只是重启了交换机,指不定过两天又会出现同样的错误,因为你没有从根本上去找到原因。所以从计量、安全、防攻击等等很多维度上说,这种细粒度的SDN都能产生巨大的价值。

Q:所以这也解决了我们很多网友的疑问,之前有些声音说云杉你做SDN这么久,大家现在做SDN的程度都大同小异,说你为什么粒度做得这么细,很多人认为你做这么细有什么价值吗,现在可能我们更能理解,实际还是从客户的需求出发。

用户关心你要解决我的问题,但是解决问题的方法在这种大规模云环境下,没有这么细是不能解决问题的。

其实做的细只是手段,我举一个例子,汽车为什么要做无人驾驶汽车这件事,是为了突出厂商造车能力强吗?不是这样的,无人驾驶汽车是最终要提高用车的效率,降低用车的成本,这是最终要做的事情。

无人驾驶汽车的粒度和有人驾驶汽车的管控粒度有什么不同呢?有人驾驶汽车的管控粒度是红绿灯,我们通过红绿灯来管理整个城市的交通,现在北京市就这样,上海、深圳也差不多都这样。但是如果管控粒度不是在红绿灯上,而是在每一个方向盘上,把它能做到这种管控粒度,对车流的管控可以做到管理每个方向盘上,这时候它的行驶效率会提高多少,它是否能最终解决交通问题?这我觉得是真正做一套控制系统要想清楚的东西,你管得越细,你肯定会做得越精。

我觉得用户不会关心云杉做这么细,或者一定要做那么细。用户关心你要解决他的问题,但是解决问题的方法在这种大规模云环境下,没有这么细是不可能解决的。只做一个管道的控制是不能解决问题的,所以我们也是一步一步做下来的。

文章第一部分「SDN是一场安静的革命」结束,我们会发布后续文章「未来网络解放老司机双手,开启“自动驾驶”模式」,欢迎持续关注。

 

您还可以通过以下方式了解更多云杉网络的信息

%e9%bb%98%e8%ae%a4%e6%a0%87%e9%a2%98_%e5%85%ac%e4%bc%97%e5%8f%b7%e5%ba%95%e9%83%a8%e4%ba%8c%e7%bb%b4%e7%a0%81_2017-08-16-1

关注云杉网络公众号 yunshannetworks,回复“精选”查看;

%e5%85%ac%e4%bc%97%e5%8f%b7%e5%9b%be

云杉网络官方网站:yunshan.net

Related Posts

“网工”何以解忧?唯有混合云网络管控NSP

SDN in China

2020年1月16日

媒体报道

面对快速崛起的云原生应用,以及更好地支持企业上云,网络必须具备弹性扩展、业务隔离、安全稳定、敏捷交付的能力。这也是企业数据中心为什么需要NSP的另一个主要原因,即实现网络服务的快速交付。

Read More

虚拟网络的“监管”之道 企业上云两手都要硬

SDN in China

2020年1月16日

媒体报道

NSP和DeepFlow®一监一管、彼此联动,形成闭环共同支撑云数据中心虚拟网络的运营。帮助企业在混合云环境中统一采集并分发任意虚拟机之间的网络流量,实现对业务关键链路的全面性能监控,并提供虚拟网络端到端的全路径诊断。

Read More