DeepFlow网络性能监控可观测部署实践案例

云杉网络

March 27, 2024

云杉动态

当然,出于数据呈现角度以及各个团队使用习惯的考虑,DeepFlow Server 端也能够以简单易用的 SQL API 方式,对外提供统一的数据服务。

案例一
比如在已有落地客户处,就有这样的使用场景。DeepFlow 可观测平台建设完成后,网络、SRE 团队习惯性地使用 DeepFlow 的 GUI 进行运维排障,而有些业务团队更习惯使用 Grafana,那么 DeepFlow 也可以作为 Grafana 的 DataSource,以及为 Grafana 增加了一些 Panel,不用修改业务代码即可展示各业务团队关注的重点业务的全景调用关系,能够准确地回答谁在访问我、以及我在访问谁的问题,同时提供非常精细的全栈指标,帮助各业务团队实现数据自服务能力。
案例二
同样,也可以在 Skywalking 中集成并展示 DeepFlow 海量的观测数据,只需要在点击 Span 的那一刻改改代码,加个页面,即可展示应用调用的全链路以及每一跳的时延,通过调用 DeepFlow SQL API 把路径逐跳虚拟网元相对应的网络 Metrics 给自动关联上,比如重传、零窗、建连失败等等,实现观测数据的共享与协作。这也是客户侧落地的一个比较轻量的方案,为业务开发团队提供无盲点的分布式追踪服务。
DeepFlow 是一个高度开放的网络性能监控、观测数据协作平台,目前底层数据平台的内核已经开源,是 CNCF Cloud Native Landscape 以及 eBPF Project Landscape 官方认证和推荐。
基于 AutoTracing、AutoMetrics 技术能够实现自动的全链路追踪,以及自动的全栈性能指标,基于 AutoTagging、SmartEncoding 技术实现多云资源池业务的自动打标,解决数据高基数场景下的性能、存储问题,以及能够集成并自动关联各团队已使用的可观测工具,如 Skywalking、Prometheus、Telegraf、oTel 等,丰富整体观测指标,有效拉通应用、中间件、容器、网络等团队的观测数据。
实现数据标签统一化、全面化,有效降低各部门间的沟通成本,专注数据的分析消费,提升跨部门协作能力。同时通过海量、标准化的观测数据,能够支撑上层一站式服务管理系统的建设,如风险治理、智能运维等,助力各企业向数字化转型方向迈进。

]]>

Related Posts

DeepFlow 智能体发布!开启业务连续性保障新时代

随着大型语言模型(LLM)日臻成熟,AI 智能体(AI Agent)从概念走向实际应用的时代已然到来。在众多的智能体使用场景中,可观测性天然具备智能体成功落地的三大要素:高质量的结构化数据、功能丰富的专业工具,以及明确的业务目标——保障系统稳定性。通过将先进的 AI 技术与可观测性场景融合,DeepFlow 智能体能够自主感知环境、推理决策并执行任务,为 IT 团队提供从日常巡检到快速诊断的全方位支持。这不仅提升了运维效率,更将 IT 人员从繁琐的日常任务中解放出来,使他们能够紧跟技术趋势,驾驭先进的 AI 工具,为业务连续性提供更坚实的保障。

Read More

DeepFlow携手保险行业巨头亮相SIGCOMM,展示AI可观测性于金融系统的价值

在美国计算机协会(ACM)旗舰会议 SIGCOMM 2025 的首届 Next-Generation Network Observability (NGNO) Workshop 上,云杉网络与中国某头部保险集团展示“基于 DeepFlow 智能体的IT健康评估和故障诊断平台”,成为全球产学研关注的焦点。作为保险行业首个实现 “可视 — 维稳 — 智能” 全阶段落地的标杆项目,其不仅印证了AI时代下智能体和可观测性技术相结合的应用价值,更为此保险科技公司践行 “科技资源整合、服务能力支撑、运营共享服务、价值创造” 四大战略定位提供了核心技术支撑,为金融行业 IT 转型输出了可复制的实践路径。

Read More