使用 sealos 一键开启 Kubernetes 应用的可观测性

云杉网络

August 8, 2022

产品资讯

一键开启可观测

DeepFlow 基于 eBPF 的零侵扰特性,能让 Kubernetes 及其上应用轻松开启可观测性能力。此前部署 DeepFlow 需要开发者掌握一定的 kubernetes、helm 等相关知识,且安装部署依赖在线镜像仓库和 helm repo。sealos 完备的系统依赖处理方案让 kubernetes、上层应用可以轻松运行在任何操作系统上,并且以其集群镜像、images-shim等方案让任何应用的离线部署变得非常丝滑。今天我们很高兴的和大家分享,sealos 4.0 已经支持了 DeepFlow 集群镜像,从此任何人在任何场景、任何环境可无障碍开启 Kubernetes 应用的可观测性。

基于 sealos 的能力,现在仅需一条命令即可拉起 DeepFlow

sealos run \
    labring/kubernetes:v1.24.0 \
    labring/calico:v3.22.1 \
    labring/helm:v3.8.2 \
    labring/openebs:v1.9.0 \
    labring/deepflow:v6.1.1 \
    --masters <Your master IP address> \
    --nodes <Your worker IP address> \
    -p <Your SSH root password>

回显内容如下(隐去了部分 sealos 输出):

Release "deepflow" has been upgraded. Happy Helming!
NAME: deepflow
LAST DEPLOYED: Fri Aug  5 14:38:07 2022
NAMESPACE: deepflow
STATUS: deployed
REVISION: 2
NOTES:
██████╗ ███████╗███████╗██████╗ ███████╗██╗      ██████╗ ██╗    ██╗
██╔══██╗██╔════╝██╔════╝██╔══██╗██╔════╝██║     ██╔═══██╗██║    ██║
██║  ██║█████╗  █████╗  ██████╔╝█████╗  ██║     ██║   ██║██║ █╗ ██║
██║  ██║██╔══╝  ██╔══╝  ██╔═══╝ ██╔══╝  ██║     ██║   ██║██║███╗██║
██████╔╝███████╗███████╗██║     ██║     ███████╗╚██████╔╝╚███╔███╔╝
╚═════╝ ╚══════╝╚══════╝╚═╝     ╚═╝     ╚══════╝ ╚═════╝  ╚══╝╚══╝


An automated observability platform for cloud-native developers.


# deepflow-agent Port for receiving trace, metrics, and log


deepflow-agent service: deepflow-agent.deepflow
deepflow-agent Host listening port: 38086


# Get the Grafana URL to visit by running these commands in the same shell


NODE_PORT=$(kubectl get --namespace deepflow -o jsonpath="{.spec.ports[0].nodePort}" services deepflow-grafana)
NODE_IP=$(kubectl get nodes -o jsonpath="{.items[0].status.addresses[0].address}")
echo -e "Grafana URL: http://$NODE_IP:$NODE_PORT  \nGrafana auth: admin:deepflow"

执行上述回显中最后三行命令,即可获取访问 Grafana 的链接,查看 Kubernetes 上所有 Node、Pod、Service 的指标、分布式追踪、日志数据。

任意微服务的应用 RED 和网络性能指标(在线文档和 Demo):

任意微服务的分布式调用链追踪,适用于 Linux Kernel 4.14+(在线文档和 Demo):

任意微服务的应用请求日志、网络流日志(在线文档和 Demo):

什么是sealos

sealos 是以 kubernetes 为内核的云操作系统发行版, 目前社区内的 sealos、lvscare、image-cri-shim、endpoints-operator 等项目致力于使用云原生的方案解决用户的各种痛点问题;laf 是一款对标腾讯云开发的杀手级函数计算应用。

sealos 核心特性:

  • 管理集群生命周期
    • 快速安装高可用 Kubernetes 集群
    • 添加/删除节点
    • 清理集群、备份与自动恢复等
  • 下载和使用完全兼容 OCI 标准的分布式应用
    • DeepFlow, OpenEBS, MinIO, Ingress, PostgreSQL, MySQL, Redis 等
  • 定制化分布式应用
    • 用 Dockerfile 构建分布式应用镜像,保存所有的依赖
    • 发布分布式应用镜像到 Docker Hub
    • 融合多个应用构建专属的云平台

GitHub 地址:🔗GitHub – labring/sealos: sealos is a kubernetes distribution. Let’s sealos run kubernetes:v1.24.0 in 3 minutes!

sealos 一经发布便获得了众多开发者的一致好评,从 kubernetes 一键安装部署、扩缩容,到率先提出集群镜像的概念及加入images-shim方案,都一直在为开发者丝滑使用 kubernetes 而努力。

引用 sealos 官网的介绍:

从现在开始,把你数据中心所有机器想象成一台”抽象”的超级计算机,sealos 就是用来管理这台超级计算机的操作系统,kubernetes 就是这个操作系统的内核!

云计算从此刻起再无 IaaS PaaS SaaS 之分,只有云操作系统驱动(CSI CNI CRI 实现)云操作系统内核(kubernetes)和分布式应用组成。

什么是DeepFlow

DeepFlow 是一款开源的高度自动化的可观测性平台,是为云原生应用开发者建设可观测性能力而量身打造的全栈、全链路、高性能数据引擎。DeepFlow 使用 eBPF、WASM、OpenTelemetry 等新技术,创新的实现了 AutoTracing、AutoMetrics、AutoTagging、SmartEncoding 等核心机制,帮助开发者提升埋点插码的自动化水平,降低可观测性平台的运维复杂度。利用 DeepFlow 的可编程能力和开放接口,开发者可以快速将其融入到自己的可观测性技术栈中。

GitHub 地址:🔗GitHub – deepflowys/deepflow: DeepFlow is an automated observability platform for cloud-native developers.

访问 DeepFlow Demo,体验高度自动化的可观测性新时代。

]]>

Related Posts

云杉网络 DeepFlow 连获中国信通院认证,智能运维落地金融、电力行业

云杉网络的DeepFlow可观测性平台近期连续获得中国信通院多项认证,其与东吴证券合作的金融全链路可观测方案和与国网四川电力合作的电力智能运维方案均入选优秀案例。该平台的核心创新在于深度融合“可观测性”与“AI智能体”技术,通过全域数据采集和智能分析,实现从被动响应到主动预防的运维模式转变。目前,DeepFlow已在金融、电力等行业成功落地,有效提升了系统稳定性与运维效率,展现了其技术先进性和跨行业普适价值,未来将继续深化生态合作,助力更多行业数字化转型。

Read More

全景性能监控如何实现多维度分析?

Air

April 18, 2025

产品资讯

在数字化转型浪潮中,企业信息系统复杂度呈指数级增长——从云端微服务集群到边缘计算节点,从高频交易系统到物联网终端设备,性能问题已从单一服务器宕机演变为跨层级、跨区域的系统性挑战。当某电商平台大促期间因缓存雪崩导致交易链路瘫痪时,运维团队需要的不只是CPU使用率图表,而是能穿透12层调用栈的立体化观测能力。这种背景下,全景性能监控正成为技术团队破局的关键武器,其核心价值在于通过多维度分析将碎片化指标转化为可行动的决策洞察。 一、构建全景监控的三维坐标体系 传统监控工具常局限于单一维度指标收集,犹如仅用温度计诊断人体健康。真正的全景性能监控体系需要建立时间、空间、业务三维坐标: 时间维度:不仅记录实时指标,更构建分钟级到年度级的趋势基线。某银行通过对比交易响应时间的*工作日模式*与节假日模式,提前48小时预测到支付通道瓶颈。 空间维度:从物理机到容器Pod,从机房光缆延迟到CDN节点负载,实现基础设施的全域映射。全球部署的流媒体平台正是借助地理热力图,动态调整边缘节点流量分配。 业务维度:将技术指标与业务KPI(如订单转化率、用户停留时长)深度关联。当API错误率上升0.5%时,智能告警系统可同步显示对应的GMV损失预估。 这种三维建模能力,使得性能数据不再是孤立数字,而是构成业务健康的动态全息投影。 二、数据编织技术打破信息孤岛 实现多维度分析的前提,是对分散在日志文件、APM探针、基础设施监控中的数据进行有机整合。数据编织(Data Fabric)架构的应用,如同为监控数据构建中枢神经系统: 智能元数据管理:自动识别Nginx访问日志中的URI模板,将其与微服务调用链中的span名称建立映射。 上下文感知的数据关联:当数据库慢查询激增时,系统能自动关联同期进行的代码发布记录与K8s集群资源变更事件。 动态数据血缘分析:通过机器学习构建指标间的因果关系图,例如识别出内存泄漏总是先于TCP重传率上升出现。 某头部证券公司在实施数据编织后,故障定位时间从平均43分钟缩短至9分钟,关键证据链的自动拼图准确率达92%。 三、多维分析的核心方法论 在数据融合基础上,多维度分析需要组合运用多种分析范式: 1. 切片-钻取分析 横向切片:对比不同地域节点的同一服务P99延迟 纵向钻取:从集群总负载下钻到具体异常的Worker节点 某云服务商利用该方法,在5分钟内锁定导致全球API延迟飙升的特定可用区网络故障。 2. 关联规则挖掘 通过Apriori算法发现隐式规律,例如: 当Kafka消费者滞后超过5000条时,订单履约成功率下降具有87%的置信度 JVM Young GC频率与Redis缓存命中率呈强负相关 3. 异常模式识别 采用DTW(动态时间规整)算法,识别与历史故障相似的趋势形态。某智能制造企业利用该技术,提前12小时预警到与半年前产线停摆相同的传感器数据模式。 四、智能引擎驱动的决策闭环 当多维分析遇见机器学习,性能监控进入认知智能阶段: 根因定位引擎:基于贝叶斯网络构建故障传播模型,在数千个可能因素中计算各节点后验概率。某次大规模服务降级事件中,系统在17秒内将根本原因从”网络抖动”修正为”配置中心的证书轮换缺陷”。 预测性容量规划:结合业务增长预测与资源利用率趋势,自动生成扩容方案。某视频平台通过此功能,在春节流量高峰前精准完成万核级计算资源储备。 自愈策略编排:对于已识别模式的故障(如数据库连接池耗尽),自动触发预案执行。某电商在2023年双十一期间实现35%的常见故障自动修复。 这些智能能力将传统”监测-告警-处理”的线性流程,升级为”感知-分析-决策-行动”的增强闭环。 五、落地实践中的关键突破点 企业构建全景监控体系时,需重点突破三大障碍: 指标爆炸控制:通过指标分级治理(核心业务指标、辅助诊断指标、长期趋势指标)和自动相关性分析,避免陷入数据沼泽。某金融机构将监控指标从12万项精简至8600项,反而提升故障识别准确率。 可视化效能革命:采用*可观测性画布*技术,支持自由拖拽多维度数据源生成定制仪表盘。运维人员可快速构建”地域×服务版本×错误类型”的三维矩阵视图。 组织协同升级:建立SRE、开发、业务部门的联合指标评审机制,确保监控维度与业务目标对齐。某互联网公司通过该机制,将业务方关注的用户流失率纳入监控黄金指标集。 随着云原生与AIOps技术的深度融合,全景性能监控的多维度分析能力正在重新定义运维边界。当每个API调用都能被置于业务流程、基础设施、用户体验组成的多维空间中审视时,技术团队获得的不仅是故障排查的望远镜,更是业务创新的显微镜。

Read More