DeepFlow全景图 轻松应对混合云业务全栈全链路性能监控

SDN in China

2020年9月10日

技术干货

Gartner 预测,2020年,90%的组织将利用混合云管理基础设施。混合云既具备公有云弹性伸缩的优点,又可满足用户对于不同类型数据的存储要求,越来越多企业的IT架构正在逐步向混合云、多云等系统转变。

01 |  混合云、多区域网络监控难度陡增

随着混合云的不断应用,传统的运维、监控方案越来越难以持续,网络监控诊断遇到了新的挑战。例如许多企业纷纷表示,现有的监控诊断方案无法覆盖日益增加的东西向流量;不同业务的网络服务、数据融合在一起后,日常运维工作变得非常复杂;以及在网络出现问题时,缺少完整的证据链帮助企业定位和排障,导致各部门之间互相推诿。由此可见网络“黑盒”已成为企业上云的一大障碍,综合用户的诉求我们主要归纳为以下几点:

  1. 数据处理能力弱:传统的分光/镜像/采样等技术只能覆盖到物理网络,其后端的NPM/安全分析能力无法适应TB级别的数据中心网络。未来随着云数据中心的流量继续快速增加,传统技术方案的局限性会越来越明显。
  2. 网络拓扑关系模糊:云数据中心的特点是各种业务由同一套系统承载,网络资源动态调整,因此很难用一幅清晰的图来解析网络,出现业务故障时的权责问题也很难理清楚,“虚拟网元”往往成为了故障的盲点。但许多关键行业的等保对此有明确要求,比如必须有能力对虚拟网络的拓扑和流量进行采集和展现,采集方式也要确保安全可靠。
  3. 安全策略不适应新的形势:在传统网络拓扑环境中,防火墙的位置是固定的,安全策略的管理相对集中。但混合云网络结构灵活多变,在海量用户、海量业务、海量数据的大背景下,虚拟机的迁移、容器的创建和销毁等等,需要全新的安全策略机制。

02 |  DeepFlow® 全景图 构建全网流量知识图谱

直接观看视频 专业人员为您讲解

企业想彻底解决虚拟网络“黑盒”问题,则需要获取完整的网络流量。下面以DeepFlow® 全景图功能为例,讲解混合云环境下的全网流量采集及监控。

全景图 - 多区域一体化管理
全景图 – 多区域一体化管理

全景图是DeepFlow® 功能之一,在v5.6.1版本提供十三个维度(包括IP、VPC、子网、区域、可用区、宿主机、虚拟机、容器节点、容器POD、业务、资源组等)的资源流量搜索和知识图谱展现,以及云网全景视图下的监控诊断解决方案。帮助用户关联网络信息、资源信息、服务信息及业务信息,统一采集并分发任意工作负载(容器/虚拟机)之间的流量,实现对业务网络的全面性能监控。

 

全景图 - 业务链条的完整监控
全景图 – 业务链条的完整监控

DeepFlow® v5.6.1版本中,全景图功能下目前有流量搜索及网络拓扑两个子功能,流量搜索聚焦于从不同的维度对虚拟网络中的流量指标数据(8类41种500多个监控指标)进行灵活检索,形成丰富多样的子视图(拓扑类、比较类、分布类、趋势类等)对流量数据进行可视化展现。且所有可视化图表均可加入自定义视图中进行进一步的组合,设置告警生成策略、设置报表生成策略。

全景图 - 网络知识图谱展现
全景图 – 网络知识图谱展现

网络拓扑功能聚焦于从逻辑、虚拟、物理的视角展现网络的配置信息和状态指标数据。完整描述各虚拟资源及虚拟网元之间的访问关系以及流量状态,帮助管理者全面掌握虚拟网络整体情况,有效应对虚拟网络内部组件关系复杂、虚拟机变动频繁等现象。

全景图 - 网络拓扑
全景图 – 网络拓扑

03 |  云网全景视图下的监控诊断

采集数据、可视化呈现只是精细化管理的第一步,接下来还要将网络信息、资源信息、服务信息、及业务信息,关联对应起来,真正用于发现问题、解决问题。例如,用户通过DeepFlow® 全景图可以确定突发的网络故障问题在哪一侧,以及业务网络端到端逐跳性能问题诊断等。

定位问题位置,如下所示:

  1. 通过精细搜索,过滤指定网流:源、目的、协议、服务端口;
  2. 通过端到端指标量对比,定位问题在客户端/服务端;
  3. 结合资源知识图谱,定位流量的资源信息。
全景图 - 定位问题位置
全景图 – 定位问题位置

端到端逐跳性能问题诊断,如下所示:

  1. 通过精细搜索,过滤指定网流:源、目的、协议、服务端口;
  2. 通过物理链路逐跳查看,展示网络性能指标的逐跳变化,定位丢包和时延位置;
  3. 通过广域网追踪,过滤网流,定位问题地域。
全景图 - 物理网络端到端逐跳性能问题诊断
全景图 – 物理网络端到端逐跳性能问题诊断

04 |  总结

DeepFlow® 全景图帮助管理者将网络状态、结构、关联和问题刻画清晰,使虚拟网络不再是运维“黑洞”。通过全网流量采集,时序数据库的分布式存储,再绘制各个维度的网络知识图谱,包括分布的维度、关联的维度、对比和回溯的维度等,最终通过对指标量的监控,实现对混合云网络的监控和性能诊断。

关于DeepFlow®

DeepFlow®是北京云杉世纪网络科技有限公司(以下简称云杉网络)推出的一款虚拟网络流量采集、可视化与分析产品。DeepFlow®基于x86集群和通用网络设备,支持集群部署,支持容器(Kubernetes)、OpenStack、vSphere虚拟化环境和AWS、阿里云、腾讯云等公有云环境,帮助企业在混合云环境中统一采集并分发任意工作负载之间的网络流量,实现对云端业务关键链路的全面性能监控,并提供云网络端到端的全路径诊断。凭借领先一代的技术优势和完整的产品解决方案,DeepFlow®已在30多家世界500强企业落地部署,不断为客户提供虚拟网络治理的最佳实践。

df%e7%94%b3%e8%af%b7%e4%bd%93%e9%aa%8c

Related Posts

解锁业务上云新挑战:DeepFlow容器网络监控诊断方案

SDN in China

2020年9月10日

技术干货

容器环境中的常见故障一般有三类。应用类故障通常表现为应用的执行状态和预期不符;容器故障通常表现为无法正确的创建、停止或更新容器;集群故障通常表现为不满足一致性或无法连接。

Read More

地产科技企业的多云网络流量管理平台建设实践

SDN in China

2020年7月13日

技术干货

该项目建设中, DeepFlow® 平台对接范围包括阿里公有云、VMware、华为公有云、华为私有云、微软公有云共5个平台。通过部署DeepFlow® 采集器、控制器和数据节点三大组件,帮助地产科技企业在混合云环境中实现了虚拟网络流量的统一采集和实时分析,实现对业务关键链路的全面性能监控,并提供虚拟网络端到端的路径诊断。

Read More