产品介绍

DeepFlow 是一款高度自动化的一站式可观测性分析平台,旨在为复杂的云基础设施及云原生应用提供深度可观测性。基于 eBPF 实现了应用性能指标、分布式追踪、持续性能剖析等观测信号的零侵扰(Zero Code)采集,并结合智能标签(SmartEncoding)技术实现了所有观测信号的全栈(Full Stack)关联和高效存取。在生产业务系统迁移上云、测试投产、上线后业务连续性、调优升级等不同阶段场景中持续提供服务保障能力。
DeepFlow Agent 采集组件
零侵扰的可观测性数据采集

DeepFlow Agent 以各种形态广泛运行于 Serverless Pod、K8s Node、云服务器、虚拟化宿主机、网关、中间件、数据库等环境中,采集这些环境中所有应用进程的观测数据。

  • 基于eBPF零侵扰采集全网云原生应用的Metrics(指标)、Tracing(追踪)及Logging(日志)观测数据,以及函数粒度的 持续性能剖析数据。
  • 同步云 API、K8s apiserver、和 CMDB 中的资源、服务及业务信息,用于为所有观测信号注入统一标签。
  • 收集主流开源 Agent、SDK 的观测数据,例如 Prometheus、OpenTelemetry、SkyWalking、Pyroscope 等。

DeepFlow Server 数据组件
可观测性数据全栈关联高效存取

DeepFlow Server 运行在一个 K8s 集群中,提供 Agent 管理、数据标签注入、数据写入、数据查询等服务。

  • 自动为所有观测数据注入统一的属性标签,包括云资源、K8s 容器资源、K8s Label/Annotation、CMDB 中的业务属性等。
  • 通过将少量预先编码的元标签注入数据中,并将大部分标签与观测信号分开存储,大幅降低了存储成本。
  • 通过自动的关联查询机制,提升了数据查询效率,让用户获得在大宽表(BigTable)上查询的体验。

功能选项

应用性能分析 APM

应用模块支持实时监控服务的黄金指标、呈现服务调用拓扑、深入分析服务调用日志并发起无盲点的分布式调用链追踪。

  • 零侵扰分布式追踪
  • 自动注入业务标签
  • 全景应用拓扑
  • 实时监控黄金指标
  • 细粒度调用日志
  • 使应用具备可观测性
查看功能讲解视频
APM
函数性能剖析 Profile

通过 eBPF 获取应用程序的函数调用栈快照,DeepFlow 可绘制任意进程的 CPU/ GPU/ MEM Profile,帮助开发者快速定位函数性能瓶颈。

  • 零侵扰函数性能剖析
  • 业务函数调用栈
  • 库函数/运行时调用栈
  • 内核函数调用栈
  • CPU、GPU、MEM 用量分析
  • CPU、GPU 调度分析
  • 分布式追踪和函数性能剖析联动
查看功能讲解视频
Profile
数据库性能分析 DBM

基于采集的观测数据支持针对TDSQL、GuassDB、OceanBase、GoldenDB、TiDB 等各类分布式数据库产品实时监控。

  • 零侵扰数据库可观测性
  • 分布式数据库全景拓扑
  • 分布式数据库全链路追踪
  • SQL 事务全链路追踪
  • 细粒度 SQL 调用日志
  • 数据库文件读写性能观测
  • 数据库函数性能剖析
  • 数据库实例黄金指标
查看功能讲解视频
DBM
网络性能分析 NPM

网络模块拥有丰富的功能支持用户对网络中的路径流量及网络性能进行实时监控。

  • 全景网络拓扑
  • 全栈链路追踪
  • 100+维度指标数据
  • 云资源知识图谱
  • 关联分析变更事件
  • 智能 NAT 追踪
  • 实时监控、分析和评估
查看功能讲解视频
NPM
网络流量分发 NPB

通过配置过滤分发策略将采集到的云内流量,精准的分发到多个流量分析工具池。

  • 面向应用的流量过滤
  • 源端Payload截断
  • 多层流量标签
  • 流量全局去重
  • 流量多路分发
  • 资源变更感知
查看功能讲解视频
NPB

新功能即将上线

敬请期待...

产品特性

任意 Service 的全景图

利用 eBPF 零侵扰绘制生产环境的全景图,包括任意语言开发的服务、未知代码的第三方服务、所有的云原生基础设施服务。内置标准协议解析能力,并提供 Wasm 插件机制扩展解析任意私有协议。零侵扰计算每一次调用在应用程序和基础设施中的全栈黄金指标,快速定界性能瓶颈。

学习了解 AutoMtrics 机制

Service

任意 Request 的分布式追踪

基于 eBPF 的零侵扰分布式追踪能力,支持任意语言的应用程序,并完整覆盖网关、服务网格、数据库、消息队列、DNS、网卡等各类基础设施,不留下任何追踪盲点。全栈,自动采集每个 Span 关联的网络性能指标和文件读写事件。从此,分布式追踪进入零插桩的新时代。

学习了解 AutoTracing 机制

Request

任意 Function 的持续性能剖析

以低于 1% 的开销零侵扰采集生产环境进程的性能剖析数据,绘制函数粒度的 OnCPU、OffCPU 火焰图,快速定位应用函数、库函数、内核函数的全栈性能瓶颈,并自动关联至分布式追踪数据。即使在 2.6+ 内核版本下,仍然可提供网络性能剖析能力,洞察代码性能瓶颈。

学习了解 AutoProfiling 机制

function

存储性能 10x ClickHouse

基于 SmartEncoding 机制,向所有观测信号注入标准化的、预编码的元标签,相比 ClickHouse 的 String 或 LowCard 方案均可将存储开销降低 10x。自定义标签与观测数据分离存储,从此你可安心注入近乎无限维度和基数的标签,且可获得像 BigTable 一样的轻松查询体验。

学习了解 SmartEncoding 机制

clickhouse

无缝集成流行的可观测性技术栈

可作为Prometheus、OpenTelemetry、SkyWalking、Pyroscope 的存储后端,亦可提供 SQL、PromQL、OTLP 等数据接口作为流行技术栈的数据源。自动为所有观测信号注入统一标签,包括云资源、K8s 容器资源、K8s Label/Annotation、CMDB 中的业务属性等,消除数据孤岛。

学习了解 集成 Prometheus 数据

无缝集成流行的可观测性技术栈