DeepFlow知识一百问 解开云上业务监管的疑问

SDN in China

2020年6月7日

产品FAQ

监控

企业上云引入的虚拟网络层级越来越多,尤其是容器技术的应用,业务网络越来越复杂,传统的监控手段在云环境下逐渐失效。

1. 对于混合云环境,怎么做全网流量监控

对于本地数据中心资源池,大部分企业已经建成了完善的传统网络监控平台,DeepFlow®支持传统监控方案标准数据的对接,针对池内虚拟网络的监控兼顾性能和侵入性的前提下提供了多种类型的采集器,并支持复用已有的监控网络平面;对于异构的本地资源池,DeepFlow®基于一体化监控平台的构建思想设计;对于公有云和分支机构的场景,DeepFlow®支持根据实际业务流量按需部署采集点,并将监控流量的处理进行本地化,处理后的数据可通过专线或公网回传到本地数据中心。

2. 混合云全网监控系统能否对特定业务的流量做牵引

数据中心南北向的流量通常不需要做牵引;东西向流量中,物理网络的流量有成熟的分光/镜像方案,而虚拟网络的流量由于巨大,应采取本地处理的策略、避免全量的复制和分发。针对特定业务的流量,DeepFlow®首先做了业务关键访问路径的梳理,并依据后端分析工具的数据要求,在监控系统的采集策略上针对梳理的结果进行流量过滤、去重、截短、压缩等预处理,进而复用已有的监控平面将流量分发给指定的后端分析工具;DeepFlow®整个采集分发方案支持一次采集、多路分发。

3. 对于虚拟机的漂移,怎么确保监控跟随以满足合规性

DeepFlow®混合云全网监控平台已对接主流云平台,能主动感知云内资源的变化,包括虚拟机/容器的漂移、创建、删除以及有关网络服务的变化。DeepFlow®流量监控和采集策略可随着云内资源的变化实时动态地下发给遍布云内的相关采集点;DeepFlow®控制器与DeepFlow®采集点的通信管理拥有独立的通信平面和必要的加密手段,确保了策略的一致性和安全性。

4. 如何满足监控体系的自动化和智能化演进

DeepFlow®混合云网络的流量监控平台采用了模块化的设计;对于底层的数据存储需采用标准格式以确保数据供给的兼容性,管理和控制平面提供了开放的接口以对接云管或第三方分析工具并支持用户二次开发;DeepFlow®应用层提供了基线告警、自定义报表及可编辑的资源管理等丰富的功能,满足企业现阶段和未来混合云IT的持续演进。

采集

在混合云环境中,全网流量的采集能力是构建一体化监控体系的前提。而流量采集的性能、安全性和对生产环境的侵入性,是企业综合考量的要素。

1. 不改动vSwitch配置,怎样流量采集

传统的东西向引流方式多采用改动vSwitch配置的方式,添加引流流表或镜像虚拟端口;该方式不仅会加大vSwitch压力,降低网络转发性能,同时流表之间也容易冲突,影响网络业务。DeepFlow®采集器不依赖vSwitch配置,直接从Hypervisor中收取原始数据包,对现网的生产环节无任何影响。

2. 怎样做容器网络流量的采集?

DeepFlow®采集器根据部署环境拥有多种型号,包括VMware ESXi采集器、KVM采集器、KVM-DPDK采集器、HyperV采集器、容器OnVM采集器、容器OnHost采集器等;采集器部署在容器计算节点上,以Pod为单元获取网络流量并进行流量预处理。DeepFlow®控制器通过与K8S的对接,学习容器环境中的集群(Cluster)、节点(Node)、Pod、服务(Service)、Ingress等信息,实现了容器资源池监控采集策略的动态跟随。

3. 虚拟网络里的采集点怎么统一部署和管理

DeepFlow®采集器无特定版本工具库或第三方组件的依赖,安装包是一个几十兆的二进制可执行文件,可在混合云场景下批量自动化极速部署,采集器部署成功后能够自动注册到控制器管理后台,一台DeepFlow®控制器能轻松管理2000个采集器。DeepFlow®控制器与采集器之间的通信采用了加密传输,可秒级启停海量控制器。

4. 怎样确保海量采集器不会影响云平台的安全和稳定

DeepFlow®采集器采集的流量从采集点发送至分析点(尤其是第三方分析工具)时仍需占用网络带宽。为最小化带宽资源占用,DeepFlow®采集器采用了云杉专利的网包压缩算法,能够将网络流量压缩至原流量大小的5%以内(仅包头和少量必须的Payload数据)。作为管理的依据,DeepFlow®采集器组件自身的状态也需要详加监控,DeepFlow®提供数十种监控指标,以可视化的方式统一呈现给管理员,做到对DeepFlow®系统运行状态一目了然。DeepFlow®系统具备过载保护机制,当生产环节系统高负载或出现宕机时,DeepFlow®采集器会自动停止工作并告警。

运维/排障

随着云基础设施规模以及东西向流量的逐步扩大,虚拟网络流量将会呈现出高复杂性、高动态性、高风险性等特征,全网流量可视化是精细化管理的第一步,虚拟网络流量的可视化是破除云网“黑盒”,高效云网运维的先决条件。虚拟网络流量可视化的价值将取决与如何将流量与租户映射,Overlay网络如何与Underlay网络映射,以及如何将网络状态与业务状态映射。

1. 怎样排查无法复现的突发故障?

DeepFlow®提供网络回溯功能,用户可针对重点业务按需全量保存任意时间长度的网络流量,以便在DeepFlow®平台或其他分析工具完整再现全部相关历史流量情况。当遇到突发突止的故障时,通过钻取存储在时序数据库中的网络流量信息(支持微秒粒度查询),回放故障发生的详细过程;也可以配置按需的PCAP采集策略,借助其他专用的第三方工具对故障进行深入分析。

2. 业务延迟高,哪个环节出了问题?

业务往往由多个网络服务环节组成,任何一个环节出现问题都会影响业务总体性能。DeepFlow®提供了端到端的诊断能力,支持逐段排查链路质量,量化表征段与段之间的流量状态,通过对网络连接的多达数十种指标的刻画(RTT、建连时间、建连成功率、最大延迟、TCP零窗次数、TCP重传次数、TCP关闭状态等),从而帮助用户快速判别是网络的问题还是应用的问题,进而厘清不同部门之间的责任边界。

3. 怎样对已知任意IP对进行端到端诊断?

DeepFlow®可对接物理网络的sFlow、NetFlow等数据,支持分光、镜像的流量采集。通过在云平台计算节点分布式部署的采集器和过滤策略,可对客户系统中已知的任意IP对的每一跳进行逐段精准的排查(网元的配置及流量信息),从而实现端到端的诊断。

运营

用户需要借助对网络流量的精细化采集,完成对不同用户的个性化服务赋能,提供差异化的增值服务,高效运营其网络资源,产生更大价值。

1. 出售云中租户带宽,难以说服客户购买更多资源?

数据中心希望客户购买更多网络带宽,但客户往往在业务出现网络瓶颈之后才考虑购买,并且对需要购买的带宽总量缺乏认识。DeepFlow提供对数据中心租户带宽使用情况的详细统计及趋势分析,帮助数据中心提供给客户需要扩容的详细量化数据,影响最终客户购买决策。

2. 虚拟机资源宝贵,如何发现空置的虚拟机资源?

虚拟机由于其灵活开通、删除、迁移的特性,在一些客户中出现了虚拟机空置的现象。DeepFlow可通过网络角度判断特定虚拟机是否在承载业务工作量,帮助用户及时收回宝贵的虚拟机资源。

3. 不同ISP专线接入,能不能实现业务创新?

数据中心采购的ISP资源往往价格存在很大差别,在没有精细化计量手段时,往往粗放地按照带宽计费,没有体现不同ISP资源的差异,造成资源浪费。DeepFlow提供精细的南北向流量计量手段,使得数据中心可按不同ISP带宽、不同流量使用情况分别计费,实现业务创新。同时调配数据中心带宽资源,实现资源的最优配置。

4. 每个月都需要总结运营情况报表,有没有人能代劳?

网络和业务部门往往需要定期对业务运营情况汇总。DeepFlow®可按用户定义的时间周期汇总周期内网络资源使用情况,详细描述汇报对象的网络使用情况,并提供PDF、CVS等多种文件格式导出。

5. 带宽采购成本均摊至业务,业务收益核算不准确?

云中运行的各项业务需要进行成本核算,以计算业务收益。但没有精细计量时,网络成本往往按照均摊的方式折算入各业务成本。DeepFlow提供灵活的业务定义及划分,并在此基础上提供网络流量的精细化计量,完成业务网络成本的准确核算,实现对业务收益的正确认知。

版权申明:
本资料中的内容和图片未经云杉网络协议授权严禁转载、链接、转贴或以其他方式复制发布/发表。

df%e7%94%b3%e8%af%b7%e4%bd%93%e9%aa%8c

 

Related Posts

关于DeepFlow的10个问题

leny

2017年6月15日

产品FAQ

关于DeepFlow的10个问题。

Read More