混合云环境与传统环境下网络监控的区别

云杉网络

August 3, 2020

解决方案

01 | 解决池内网络流量“黑盒”问题 对于企业混合云环境,资源池池化是明显的特点之一。由于业务微服务化,池内东西向流量是网络监控保障的重要部分。池内流量不再由物理网络设备实现交换,而是由运行在主机上的虚拟机完成交换。获取完整的虚拟交换机流量,打开网络“黑盒”是网络保障的第一步。获取池内网络流量,需要解决采集点数量大,采集器状态、性能管理,策略同步及统一管理等问题。

02 | 网络端到端追溯问题

传统 NPM 厂商,一般通过物理网络采集点来跟踪网络端到端路径。但在云环境中,虚拟机、容器等承载服务单元都运行在资源池内,造成排障路径中断。仅有南北向流量是不足以具备端到端画像能力。 1

03 | 多维度数据关联

云环境中,NPM 工作不能与云平台,容器平台信息割裂。单纯的网络维度,如 IP、端口、网流等信息,在运维保障、精细化运营、资源规划等场景中,需要有效关联虚拟机名称、宿主机信息、VPC、迁移事件等。比如在运维排障过程中,网络异常报警后,知晓网络路径属于哪个业务,涉及 IP,运行在哪些资源池及宿主机之上,云平台是否出现虚机迁移,负载均衡失效等事件。 2

04 | 随云扩展而扩展的网络监控架构

在生产平面一侧,计算、网络、存储都实现了弹性可扩展,可支持波动性大的服务应用,但在监控侧,同样需要符合云架构的监控体系,满足云架构的要求。
  1. 资源池种类多,且不断扩容变化,网络监控应有能力快速应对扩展变化,在同样的监控框架下,流量采集侧快速支持资源池数量,种类变化。
  2. 采集与分析解耦,可实现统一的流量采集预处理抽象层,具备一次采集,多处分析的能力。
  3. 为基础设施团队提供网络数据服务能力,满足安全态势、业务审计等各类大数据平台对网络数据的需求。

05 | DeepFlow® 解决云端业务的网络问题

DeepFlow® 混合云网络监控诊断解决方案针对云数据中心使用场景,从十几个维度全方位解析网络流量的特征(关联网络、资源池、应用等),绘制网络图谱,为企业混合云、云原生环境建设可扩展的网络流量监控诊断平台,实现对全网流量监控,应对 KVM、ESXi、容器等各类资源池内的网络性能分析。 %e7%9b%91%e6%8e%a7%e8%af%8a%e6%96%ad%e6%96%b9%e6%a1%88%e9%95%bf%e5%9b%be1 %e5%85%a5%e7%be%a4%e4%ba%8c%e7%bb%b4%e7%a0%81]]>

Related Posts

DeepFlow:利用 eBPF 实现 AI 大模型训练与推理的全栈零侵扰可观测性

在大模型训练与推理全面进入“重算力、强分布式、异构硬件”时代,DeepFlow 基于 eBPF 提供零侵扰、全栈、可持续的可观测性能力,覆盖从 Python 代码到 GPU/RDMA 网络,解决训练低效、推理体验不可控与异构智算黑盒三大核心问题。

Read More

基于eBPF技术的LLM推理服务全栈可观测性:架构、挑战与实践

本文系统性阐述了在云原生环境下,利用扩展伯克利包过滤器(eBPF)技术实现大语言模型(LLM)推理服务全栈可观测性的方法与架构。内容涵盖自建千亿参数LLM推理服务在异构硬件(如昇腾910B)与分布式框架(如vLLM, Ray)下面临的挑战,分析了传统可观测性三大支柱(指标、追踪、日志)及新兴性能剖析支柱的不足。文章重点介绍了DeepFlow平台如何通过eBPF实现零代码侵入的全栈指标采集、全链路追踪与混合栈(CPU/GPU)性能剖析,并辅以智能体应用与中国移动的落地案例,验证了该方案在优化GPU利用率、定位推理延迟及适配流式协议等方面的有效性。

Read More