DeepFlow®助力四川电信提升多地市级政务云虚拟网络统一监控运维管理

云杉网络

October 11, 2019

解决方案

背景

四川作为人口和经济大省,依托本地丰富的电子信息产业和人才资源,四川在全国省级政府系统中较早意识到云计算在电子政务建设中的重要作用。截至2017年底四川政务云已完成40余个省级部门、约400个非涉密信息系统的云化迁移和应用,各地市州也建立市级政务云并积极对接省级政务云平台,四川电信作为最专业的信息化服务商,承建并运营了省级政务云及省内多个地市的政务云。

四川电信省公司网络监控维护中心负责对平台类、安全类等重大疑难故障、重大技术评估等二线支撑工作;负责IDC核心网络故障处理,通过建设云网流量分析系统,自动生成网络故障的告警、告警信息传送给工单系统自动生成工单,对故障进行处理回溯分析,故障根原因定位,责任判定。

%e5%9b%9b%e5%b7%9d%e7%94%b5%e4%bf%a11

痛点

目前各级政务云在上线运行也近三年有余,前期政务云更着重云平台建设,将各单位的应用迁移到云上,推进政务云化;随着运行实践的过程中,逐渐发现各地市州云建设的程度和运营管理水平不尽相同,云网络维护手段有限,只能依靠云平台自带的管理系统进行维护,运维管理模式不统一,存在烟囱式维护管理缺陷。

政务云业务系统运营过程中,出现了一些难以预测的、类似网络抖动的用户保障,由于缺乏虚拟网络流量采集的手段,对此类突发突止且毫无规律的问题难以复现、也无法定位问题的根本原因,为云平台运营埋下了隐患。缺乏对故障回溯的机制,因此需要对云服务商的虚拟网络流量进行采集,增强网络的整体可视化程度和分析粒度。

解决方案

云网流量分析监控中心建设是本次整体运维建设工作的一个重点,通过监控大屏,云网流量监控中心可以监测下级平台网络状态,包括地市接入网络、地市虚拟网络、业务网络、定制报表中心、告警管理中心、系统管理等,可及时深入查询和分析重要问题。云网流量监控中心支持虚拟化部署,能够同时处理数十个数据中心的数据,借助全域报表,依据统一制定的关键KPI指标,督促管理,提高全网管理水平。

虚拟网络性能监控

四川电信与云杉网络合作,通过旁路方式将DeepFlow®部署在重点城市政务云本地,实时监控虚拟网络关键路径上的各项网络性能指标,以此判断网络质量和性能瓶颈点,快速排查和定位网络故障,降低安全隐患问题对政务云所产生的影响。当需要对历史问题进行回溯分析时,业务人员可以像使用搜索引擎一样检索指定业务端口的历史流量信息的历史流量并复现指定时段的故障现场。

客户收益

通过云网流量监控中心,省级单位实现对各地市级政务云虚拟网络流量的数据监控,实现数据管理的集中化与网络管理的分层化,提高了统一运维管理能力。各地级市业务人员可根据业务特性在DeepFlow®上配置合理的告警策略,通过对接工单系统,将生成的网络故障告警信息实时的传送给工单系统自动生成工单,使运维人员能够第一时间处理云内关键业务系统的故障点,减少业务故障所带来的经济损失。

云杉网络DeepFlow®在四川电信的落地,大大提高了省公司及本地运维团队对虚拟网络的运维管理效率,云杉网络与四川电信的合作方案,将逐步推向与四川省其他地级市,以实现四川省政务云虚拟网络的统一运维管理目标,逐步提升四川电信政务云的用户体验和服务水平。
%e4%b8%ad%e7%be%8e%e8%ae%ba%e9%81%93%e7%be%a4
]]>

Related Posts

DeepFlow:利用 eBPF 实现 AI 大模型训练与推理的全栈零侵扰可观测性

在大模型训练与推理全面进入“重算力、强分布式、异构硬件”时代,DeepFlow 基于 eBPF 提供零侵扰、全栈、可持续的可观测性能力,覆盖从 Python 代码到 GPU/RDMA 网络,解决训练低效、推理体验不可控与异构智算黑盒三大核心问题。

Read More

基于eBPF技术的LLM推理服务全栈可观测性:架构、挑战与实践

本文系统性阐述了在云原生环境下,利用扩展伯克利包过滤器(eBPF)技术实现大语言模型(LLM)推理服务全栈可观测性的方法与架构。内容涵盖自建千亿参数LLM推理服务在异构硬件(如昇腾910B)与分布式框架(如vLLM, Ray)下面临的挑战,分析了传统可观测性三大支柱(指标、追踪、日志)及新兴性能剖析支柱的不足。文章重点介绍了DeepFlow平台如何通过eBPF实现零代码侵入的全栈指标采集、全链路追踪与混合栈(CPU/GPU)性能剖析,并辅以智能体应用与中国移动的落地案例,验证了该方案在优化GPU利用率、定位推理延迟及适配流式协议等方面的有效性。

Read More