假如不能对全网流量采集,你真的能驾驭混合云吗?

毫无疑问,在全球范围内,混合云已逐渐成为企业上云的主要方式。RightScale 2019年云状态报告显示,有58%的受访企业采用了混合云战略;MarketsandMarkets预测,到2021年混合云的复合增长率将达到22.5%。混合云受欢迎背后的原因也不难理解,它提供给了企业更为适合的架构,在弹性敏捷和平稳可控之间做平衡。

在国内,诸多大中型企业已经开启实施混合云战略。例如,中国地产行业的龙头万科地产,通过打通包括公有云资源池在内的5朵云,万科不断推动云化改造,赋予业务系统更高的弹性与敏捷性,加速应用创新迭代。当然,像万科这样混合多云实践的行业代表还有很多,诸如金融、医疗、政务等行业,通过整合联动私有云、公有云、第三方虚拟化资源池等,满足敏态业务和稳态业务的需要,实现混合多云资源的统一管理。

不过,伴随混合云实施带来灵活性优势的同时,它也带来了IT管理上的挑战。基础设施资源池的多样化,意味着要同时面临管理物理机、虚拟化、云等异构环境的问题,包括资源管理、运维管理、服务运营管理等。一定程度上,面向混合云资源和业务应用的统一管理已经得到极大改观,但在网络的运维和监控层面还存在巨大短板,监控盲点多、网络运维可见性差问题明显,这也让不少IT负责人大呼难以驾驭混合云。

那么,混合云网络监控到底难在哪?

 

混合云暴露出的监控难题

网络监控的目的是便于对网络故障的定位、排除,以及进行性能分析、安全管理等,所以有能力获取完整的网络流量是实现这一切的必备前提。换言之,如何消除木桶原理中的“短木板”更显得十分重要,因为当网络故障发生时,问题也许就存在于那个看不见的“短板”中。然而,混合云环境下暴露出了传统网络监控上的多个短板和盲点。

首先,混合云涉及的监控面众多,这包括私有云环境中的各类资源池,例如OpenStack、VMware、裸金属、容器等;从网络区域中划分,又涉及到业务区、互联网接入区、外联区、DMZ区等;在云计算转型比较深入的企业中,还会涉及到更多的网络功能服务链。对于部署混合云的企业而言,网络规模越来越大、层级越来越多、异构的网络服务愈加多样化,所以,本身获取到这些不同界面的流量就不是一件轻松的事,更不用提对它们进行管理了。

其次,从监控方式来看,传统IT环境中,获取网络流量主要在网络设备及物理链路上,汇聚分流和镜像是成熟的方案选择。但到了云尤其是混合云环境下,这显然不能完整地描绘逻辑网络的全部流量视图,网络可见性大打折扣。此外,容器和微服务不断获得大量企业的青睐,并在生产环境中开始被广泛采用。容器网络让IP与资源的对应关系经过至少二层转换,并且容器环境的节点庞大,更难以对其流量进行采集和监控,导致大部分容器环境中的流量还是盲点“黑盒”状态。

 

传统网络监控工具的“全局性”缺失

虽然市面上有很多监控方案可供选择,不少多云用户也部署了多种监控工具,例如网络厂商的运维工具、NPM厂商的采集分析工具、应用性能管理工具,以及云厂商的数据采集工具等。但它们大多是针对各自擅长的场景,有的了解数据中心、有的了解云、有的以应用为中心,但是无法把这些能力整合起来,并且面临网络规模适应的局限性。

混合云挑战下,有前瞻性的企业部署了现代化的基础设施监控工具,例如AIOps等。即使如此,依然不能满足需求。根据Forrester的调研报告,12%使用现代基础设施监控工具的受访者表示,他们仍然难以获得端到端的可见性和扩展性以支持整个企业网络运维。

混合云环境下,企业需要的不再是了解单个网络单元的健康状态和性能,而是一种全局性的监控解决方案。由点到面,对全网流量进行采集,让复杂的云环境得到管理是企业所需要的。

 

如何选择随云而动的流量采集方案?

企业IT架构不断变迁,混合云环境下要保持对全网流量的可见性,那么该如何选择流量采集与分析方案?首要第一位需具备对各类资源池实现统一流量采集抽象层的能力,即对全网流量进行采集及处理。这其中涉及以下几个重要方面需要考虑:这包括流量获取的方式、环境中的流量模型、规模及可管理性、对现网环境的影响,以及平台开放性等。

在流量获取方式上,通常有以下几种方案:在虚拟机或工作负载(Workload)中安装采集探针,从操作系统层面获取需要的信息,包括各个接口的流量;通过在虚拟交换机(OVS : OpenvSwitch、VDS : vSphere Distributed Switch、VSS : Virtual Standard Switch)上配置镜像或广播策略,将所需流量引出;在宿主机Hypervisor(如Openstack Hypervisor)上通过安装采集探针,以用户态进程形式独立获取虚拟交换机上的流量,不需要对生产平面的虚拟交换机进行配置。对于企业而言,具体选择哪种采集方式最优,需要根据IT网络及资源池的实际环境情况进行选择配置或者组合。

在规模及可管理性方面,混合云环境中,网络规模宏大且资源池类型繁多,需要考虑多数据中心的整体方案,避免针对不同需求重复安装探针,分散建设分散管理的情况。尤其在容器环境下,其资源随应用需求变化频繁发生迁移、切换或回收,流量采集策略、流量分发策略也要随着变化进行迁移或释放。

在对现网环境的影响上,流量采集系统的部署需要满足平滑部署且保证业务不间断,也要保证对已有的物理网络分流镜像有能力进行兼容或平滑切换,并可以对接已有的分析工具。在平台开放性方面,对于流量数据应具备一次采集,可按需多处进行分发消费的能力,避免采集端与消费端绑定。

此外,还有一个关键点不容被忽略,那就是性能问题,即全网采集不能也必然不被允许消耗过多的系统资源。这其中流量获取的方式和能力至关重要,例如传统上通过在交换机上设置镜像策略虽可以获取虚拟交换机的流量,这除了带来侵入生产网络转发平面的弊端外,也需耗费更高的计算资源提升虚拟交换机的处理性能。对于企业来说,毫无疑问希望用更低的资源占用(CPU、内存)、更轻量化的方式部署网络流量采集与分发方案。

 

云杉网络DeepFlow®“五脏俱全”的秘密

作为中国最早成立的SDN企业,云杉网络针对数据中心虚拟网络的监、管、控方案赢得众多大型企业客户的青睐。云杉网络DeepFlow®为企业混合云建立起统一高效的网络流量采集及处理平台,它是如何做到的?

在数据中心侧,各类型号的DeepFlow® Trident流量采集器为全网流量采集方案提供了最优的网络流量捕获能力;在公有云侧,Workload采集器以用户态的软件形式部署在虚拟机、容器、裸金属设备等Workload上,支持Linux、Windows等主流操作系统, 实现VPC内各类资源的网络流量采集;在管理控制侧,云杉网络DeepFlow® 整体可满足10万台采集器规模,具备支撑大型企业私有IT、公有云、容器等对网络流量的采集要求。

此外,DeepFlow® 还通过过滤、去重、压缩、截短、封装等多种流量预处理能力,降低采集信息传输带宽并提升了性能,最终可实现对单一采集器仅需配置1核CPU、128M内存的资源使用。目前,云杉网络DeepFlow® 先后已在金融、电信、互联网等行业的30多家世界500强企业云数据中心部署落地,为客户解决了云环境下网络流量的一体化采集难题。

除了上文谈到的帮助万科地产对多个云资源池流量进行采集、分析和监控,快速定位和排查网络故障外。在民生银行,其借助DeepFlow® 采集与分发平台,打通了工具链孤岛、提高了运营效率,加速了向数字化、轻型化、综合化标杆银行的转型;在平安云,云杉网络DeepFlow® 不仅为其网络部门提供服务,也为安全、系统等部门提供服务,在异常流量分析、渗透攻击发现、业务优化等方面提供支撑依据;在中国移动,河南移动私有云通过与云杉网络合作,基于DeepFlow® 简化了大规模网络的管理与运维,轻松管理2000节点,提高了运营效率。

众多的企业在混合云等新型 IT 基础设施环境演进中,选择一个能对全网流量采集与分析的方案必不可少,这也是驾驭混合云的前提。云杉网络之所以获得众多大中型企业的认可,离不开其近十年的技术经验积累,在产品性能、功能、架构设计等方面都有着明显的优势。随着企业IT架构的不断演变,云杉网络DeepFlow® 弥补了传统监控工具的短板,基于完整、可持续的平台级监控流量管理,重新打开了网络可见性,让云网更清晰。

%e5%85%a5%e7%be%a4%e4%ba%8c%e7%bb%b4%e7%a0%81

Related Posts

云杉网络NSP荣获2021年度中国SDN、NFV、网络AI优秀案例

云杉网络NSP网络服务平台面向运营商和大型行业客户,满足云时代企业业务快速发展对网络服务不断增长的需求。NSP由一系列自主研发的SDN、NFV软件产品构成,并与国内外主流网络设备商及云服务商进行了深度集成,为企业打造了云数据中心、边缘云、广域网、网络安全等一系列解决方案,实现了面向业务且高度自动化的网络编排、服务配置和运维管理等关键功能。

Read More

【直播预告】云原生可观测性分享会 第二期 | 开启愉悦时刻!

可观测性在开源和商业上已经有了大量的解决方案拼图,本期云原生可观测性分享会 将分享可观测性的3个实践方案,通过对云原生、车联网、容器化微服务的实战用例分析,进一步说明可观测性可以解决的实际问题,希望能为组织选择适合自身的可观测性方案提供指导,以及可观测性如何为各行业的IT人员带来认知与技能的真正提升。

Read More