DeepFlow v5.5.5发布 回溯取证功能重装上阵

云杉网络

September 5, 2019

产品资讯

近日,云杉网络发布了DeepFlow® v5.5.5版,回溯取证功能在该版本重新亮相,在性能和功能方面均有较大提升。主要的更新如下:

总览界面:

  • 总览界面主要展现系统运行的有关信息,包括监控网络中的采集器、物理采集点、虚拟采集点数量以及最近24小时的告警信息;
  • 此外还展现业务层面的统计信息,例如租户、业务、VPC、IP地址统计以及网络层面的云平台、区域、交换机、宿主机统计。

全景图:

  • 对资源拓扑界面进行了优化,调整了相关组件,提高了易用性;
  • 在网络连通性判断的基础上新增了 VPC 的连通性判断;
  • 查询条件中增加过滤流量范围,流量拓扑界面用户可自行选择节点TOP N显示;
  • 流量统计界面新增TCP FLAG统计,实例流量统计界面新增告警快捷键。

细粒度流量分发:

  • 提供从VPC到五元组粒度的流量筛选功能,
  • 支持全包任意长度截断分发功能,
  • 新增了VXLAN接收器,
  • 支持的过滤协议也大幅增加,
  • 支持一份流量多路分发功能,满足各种流量消费端的需求。

业务画像:

  • 资源拓扑展示资源层级和连通性关系,流量拓扑图提供更直观的流量关系的展示,
  • 新增了接入网络业务,用户可以基于VLAN或源/目的资源组,规划某一条数据中心网关业务关键路径上的访问关系,并对数据中心网关业务的流量做细致分析,
  • 新增流量统计功能,统计当前业务结构下最近1小时的流量情况,并可基于统计结果快速创建资源组和关键路径,
  • 提供多维度、多视角的流量统计,数据中心网关业务的性能分析调整至接入业务性能分析。

网络诊断:

  • 逻辑网络资源管理支持所有云平台的对接,
  • 端到端路径诊断支持IP+端口+协议搜索,用户可从逻辑网络到虚拟网络层面看清网络拓扑的配置和部署是否异常,
  • PCAP下载支持和适配了接入网络流量,支持丰富的五元组过滤采集并保存标准的PCAP文件供用户详细分析。

回溯取证:

DeepFlow®提供基于完整会话(即五元组)数据,并满足等保规范至少6个月的保存要求。在此基础上DeepFlow®提供多维度的检索条件,帮助用户进行网络性能问题、安全问题的深度分析,用户可作为合规性安全检查的取证工具,亦可作为日常巡检辅助工具。DeepFlow®回溯取证数据详细度具体包括以下方面:

  • 网络和性能问题取证:获取基于五元组完整会话的流量、速率、延迟、响应时间、会话持续时间等,对故障点做详尽的取证分析,
  • 安全问题取证:通过回溯任意时间点高危服务端口的历史流量访问情况,包括访问时间、访问流量(发送和接收)、源端IP地址信息等;当主机被感染造成业务故障时,通过回放该主机的所有会话信息准确定位时间点,协助用户确定感染原因,为漏洞扫描和安全防范提供指导,
  • 会话详情列表项包含:结束时间、源/目的IP地址、源/目的端口、协议、发送/接收流量/包数、持续时间、延迟、重传率,
  • 每条会话包含:源/目的MAC地址、VLAN ID、业务名称、路径名称、源端/目的端RTT延迟、源端/目的端重传次数、系统平均响应时间、应用平均响应时间、源端/目的端零窗口次数、源端/目的端TCP标记、源端/目的端项目、状态信息,
  • 多维度检索查询支持采集点选择、支持IP网段及多种运算符查询;多维度展示图按照用户所选维度指标从左至右呈现相关内容,用户可通过鼠标拖拽调整不同维度数据展示的位置。

多云平台适配:

  • 在多云、混合资源池等复杂网络环境下能快速对接用户云平台;提升了采集器的安全性,控制器性能提升了一倍;策略匹配支持 IPv6资源组,
  • 提升了系统性能,支持手动重新均衡采集器所关联的分析器,存储配置新增对PCAP下载数据、四元流数据的支持,
  • 资源管理的所有资源列表都增加租户筛选过滤,公有云增加了学习SLB负载均衡器。
报表功能:
  • DeepFlow®以关键路径的指标数据为主体生成报表内容,用户可在性能分析页面创建报表策略,从性能分析可跳转报表管理界面进行报表预览、下载、删除以及报表策略修改和删除等操作。
  • 报表周期为日/周/月报表,报表格式调整为HTML格式。
其他改进:
  • 性能分析功能增加最近一天流量速率和包速率的秒级监控,多路径增加包速率指标监控,
  • 对采集器的采集包速、CPU、内存等资源消耗实现了强控制,用户可提前规划采集器所需资源,做到采集器对系统零侵入。

关于DeepFlow®

北京云杉世纪网络科技有限公司「简称:云杉网络」作为深耕SDN技术的创新型公司,致力于开放网络架构。DeepFlow®是云杉网络推出的一体化网络流量采集、分发和分析平台。DeepFlow®以SDN技术为核心,基于x86集群和通用网络设备,为多云环境提供一体化的网络解决方案。目前,DeepFlow®已经在金融、电信、制造业、教育、互联网等多个行业的30多家云数据中心落地,帮助用户在业务数字化转型的过程中,提高其数据中心运营的整体效率。

]]>

Related Posts

云杉网络 DeepFlow 连获中国信通院认证,智能运维落地金融、电力行业

云杉网络的DeepFlow可观测性平台近期连续获得中国信通院多项认证,其与东吴证券合作的金融全链路可观测方案和与国网四川电力合作的电力智能运维方案均入选优秀案例。该平台的核心创新在于深度融合“可观测性”与“AI智能体”技术,通过全域数据采集和智能分析,实现从被动响应到主动预防的运维模式转变。目前,DeepFlow已在金融、电力等行业成功落地,有效提升了系统稳定性与运维效率,展现了其技术先进性和跨行业普适价值,未来将继续深化生态合作,助力更多行业数字化转型。

Read More

全景性能监控如何实现多维度分析?

Air

April 18, 2025

产品资讯

在数字化转型浪潮中,企业信息系统复杂度呈指数级增长——从云端微服务集群到边缘计算节点,从高频交易系统到物联网终端设备,性能问题已从单一服务器宕机演变为跨层级、跨区域的系统性挑战。当某电商平台大促期间因缓存雪崩导致交易链路瘫痪时,运维团队需要的不只是CPU使用率图表,而是能穿透12层调用栈的立体化观测能力。这种背景下,全景性能监控正成为技术团队破局的关键武器,其核心价值在于通过多维度分析将碎片化指标转化为可行动的决策洞察。 一、构建全景监控的三维坐标体系 传统监控工具常局限于单一维度指标收集,犹如仅用温度计诊断人体健康。真正的全景性能监控体系需要建立时间、空间、业务三维坐标: 时间维度:不仅记录实时指标,更构建分钟级到年度级的趋势基线。某银行通过对比交易响应时间的*工作日模式*与节假日模式,提前48小时预测到支付通道瓶颈。 空间维度:从物理机到容器Pod,从机房光缆延迟到CDN节点负载,实现基础设施的全域映射。全球部署的流媒体平台正是借助地理热力图,动态调整边缘节点流量分配。 业务维度:将技术指标与业务KPI(如订单转化率、用户停留时长)深度关联。当API错误率上升0.5%时,智能告警系统可同步显示对应的GMV损失预估。 这种三维建模能力,使得性能数据不再是孤立数字,而是构成业务健康的动态全息投影。 二、数据编织技术打破信息孤岛 实现多维度分析的前提,是对分散在日志文件、APM探针、基础设施监控中的数据进行有机整合。数据编织(Data Fabric)架构的应用,如同为监控数据构建中枢神经系统: 智能元数据管理:自动识别Nginx访问日志中的URI模板,将其与微服务调用链中的span名称建立映射。 上下文感知的数据关联:当数据库慢查询激增时,系统能自动关联同期进行的代码发布记录与K8s集群资源变更事件。 动态数据血缘分析:通过机器学习构建指标间的因果关系图,例如识别出内存泄漏总是先于TCP重传率上升出现。 某头部证券公司在实施数据编织后,故障定位时间从平均43分钟缩短至9分钟,关键证据链的自动拼图准确率达92%。 三、多维分析的核心方法论 在数据融合基础上,多维度分析需要组合运用多种分析范式: 1. 切片-钻取分析 横向切片:对比不同地域节点的同一服务P99延迟 纵向钻取:从集群总负载下钻到具体异常的Worker节点 某云服务商利用该方法,在5分钟内锁定导致全球API延迟飙升的特定可用区网络故障。 2. 关联规则挖掘 通过Apriori算法发现隐式规律,例如: 当Kafka消费者滞后超过5000条时,订单履约成功率下降具有87%的置信度 JVM Young GC频率与Redis缓存命中率呈强负相关 3. 异常模式识别 采用DTW(动态时间规整)算法,识别与历史故障相似的趋势形态。某智能制造企业利用该技术,提前12小时预警到与半年前产线停摆相同的传感器数据模式。 四、智能引擎驱动的决策闭环 当多维分析遇见机器学习,性能监控进入认知智能阶段: 根因定位引擎:基于贝叶斯网络构建故障传播模型,在数千个可能因素中计算各节点后验概率。某次大规模服务降级事件中,系统在17秒内将根本原因从”网络抖动”修正为”配置中心的证书轮换缺陷”。 预测性容量规划:结合业务增长预测与资源利用率趋势,自动生成扩容方案。某视频平台通过此功能,在春节流量高峰前精准完成万核级计算资源储备。 自愈策略编排:对于已识别模式的故障(如数据库连接池耗尽),自动触发预案执行。某电商在2023年双十一期间实现35%的常见故障自动修复。 这些智能能力将传统”监测-告警-处理”的线性流程,升级为”感知-分析-决策-行动”的增强闭环。 五、落地实践中的关键突破点 企业构建全景监控体系时,需重点突破三大障碍: 指标爆炸控制:通过指标分级治理(核心业务指标、辅助诊断指标、长期趋势指标)和自动相关性分析,避免陷入数据沼泽。某金融机构将监控指标从12万项精简至8600项,反而提升故障识别准确率。 可视化效能革命:采用*可观测性画布*技术,支持自由拖拽多维度数据源生成定制仪表盘。运维人员可快速构建”地域×服务版本×错误类型”的三维矩阵视图。 组织协同升级:建立SRE、开发、业务部门的联合指标评审机制,确保监控维度与业务目标对齐。某互联网公司通过该机制,将业务方关注的用户流失率纳入监控黄金指标集。 随着云原生与AIOps技术的深度融合,全景性能监控的多维度分析能力正在重新定义运维边界。当每个API调用都能被置于业务流程、基础设施、用户体验组成的多维空间中审视时,技术团队获得的不仅是故障排查的望远镜,更是业务创新的显微镜。

Read More