【SDN茶话会】上海站总结:金融企业的上云实践

2018年6月28日下午,由云杉网络主办的“SDN茶话会”在上汽上海文化广场的十二间·山举行。众所周知企业上云难、金融上云更难。上海是全国金融中心,金融行业作为上云的排头兵,自然云集了各路网络豪杰。本次活动我们邀请了甜橙金融、兴业数金以及中国银联的三位“茶博士”与云杉网络一起,分享金融企业上云的实践之路。

813198199138042139

SDN在金融云网络的价值之自动化运维

▌云网上的故障有啥不一样?

金融行业上云有一半的因素来自“十三五”规划和监管政策。面临的挑战自不必说,没有先行者的经验可以参考,因此该踩的坑一个都不会少。以兴业数金为例,数金云在上海有3个数据中心,数金云的网络被划分为4个区域,数据中心的网络采用SDN集中控制——所有流表均通过控制器下发,形成了由上而下烟囱式的管理模式。

image3

由于SDN的灵活性和细粒度,复杂度的问题随之而来,对数金云来说,网络运维的工作量不但没有降低反而增加许多。数金云的网络环境在业内也很少见。比如按照监管的要求物理防火墙是不可或缺的设备,但数金云内部虚拟防火墙的规则下发和物理防火墙的规则下发是不一样,甚至规则条目数存在最大1024的限制。通常的POC测试关注的对象是网络带宽等参数,因此很难发现此类瓶颈。

另外,数金云还面临扩容的问题,由于SDN的技术变化太快、受制于厂商的技术方案,运维人员不得不进行停机扩容。然而,最头疼的问题在于云上的故障与传统的故障现象不一样,比如Ceph性能降低的表象是延迟大,但你无法断言这是网络的问题还是I/O的问题。在缺乏有效监控手段的时候,网络团队往往成了背锅侠。

▌上云之后最大的工作是排障和沟通

甜橙金融的业务架构变迁可以说是金融企业上云的一个缩影,其网络由传统三层架构+X86服务器,最终走向了SOA的架构。在这个过程中,传统的网络问题不断地在云网络中复现,例如生成树的问题、脑裂的问题、VxLAN的问题等。随着业务的发展以及业务之间的频繁交互,网络更多地参与到了计算过程中来。

image1

一个业务如果延迟几十毫秒,客户就能很明显地感知到。当业务部门终于意识到,唯有运维能对生产的可用性做保障时,业务上线流程的标准化工作才开始转交到运维手中,运维终于不再依赖“重启、重装、换电脑”三件宝,而是梳理业务和网络,优化流程、制定规范。经过努力,甜橙金融已经做到系统升级服务不中断、用户无感知,平台服务可用率、运维可用率大幅提升,单机处理能力和支付宝、微信等水平一致。以业务割接为例,甜橙金融可以在8小时内完成70T数据的异地割接,以前要先耗时3天做好负载均衡才能开始业务割接。经过梳理,平台内多达5W条的网络策略,现在缩减到1W条。在上云、上SDN的过程中,最大工作量是排障、是和业务的沟通。

SDN在金融云网络的价值之网络闭环

▌探索Telemetry的可行性

随着市场的发展,无论是传统金融机构还是新型互联网金融巨头,金融科技已经成为各机构发展的新趋势。目前,国内已有6家银行(民生、建行、招行、兴业、光大、平安)先后设立了科技子公司。但金融监管要求资金支付交易能“断直连”,中国银联既要面对监管的要求,又要满足其2020年IT建设规划指标。在高起点、高定位、参考业界最佳实践、成体系构建技术框架的指导纲领下,中国银联开始积极探索Telemetry在构建云计算智能网络中的可行性。

在构建智能云网监控的过程中,对网络流量和网络信息的采集和处理至关重要。INT「In-band Network Telemetry」实现了网络设备主动推送状态信息的能力,具有更强的时效性,INT「In-band Network Telemetry」在云网环境中的应用有望给监控运维带来突破性的改变。

image2

在业务架构方面,分布式、模块化、微服务的设计使得网络数据能够在更多的维度进行展现。而海量数据则进一步推动了新型算法和采集技术的发展。在网络技术方面,可编程交换芯片与可编程交换机的发展带动了以P4为代表的开源技术的突飞猛进,其中报文级的可视化被誉为实现云网镜像、智能监控的明星功能。

▌让云网络可见、可知、可查、可管、可控更可靠

由于业务上云、上SDN之后,网络的架构变了,数据中心网络流量出现了“二八”反转,业务交付的模式由原来的静态规划变成了动态伸缩,云网络的运维成了棘手问题。如前文所述,“成功网络都一样、摔跟头的各不同。”我们不妨看看业界已有的最佳实践是如何建设的。

image4

金融云的要求稳定、安全、合规。现有的主流解决方案表明,要想满足这些需求,首先要构建一个网络数据监控平台,从而实现网络数据可采集、关键信息可提取;然后通过大数据和机器学习的技术对采集到的网络数据进行挖掘分析,借助分析能力实现云网络的可见、可知、可查、可管;根据分析的结果对网络进行必要的优化调整,最终走向网络智能化。

从数据源采集到分析引擎挖掘,云杉网络实现了对网络数据洞察,从而指导业务的决策控制。基于上述方案,云杉网络DeepFlow®在金融行业中实现了流量可视化、业务画像、安全诊断、业务优化、安全审计、运营决策(计量/资源分配)等场景的应用落地,帮助金融客户解决了快速排障、精确计量计费、异常网络流量分析、安全白名单等难题。

小提示

扫描下方二维码观看SDN茶话会直播回放,同时,还可以下载演讲嘉宾PPT。了解DeepFlow产品,请进入公众号菜单栏,下载白皮书和案例。 [caption id="attachment_1065" align="aligncenter" width="150"]长按观看直播回放、下载PPT 长按观看直播回放、下载PPT[/caption]  
%e4%b8%ad%e7%be%8e%e8%ae%ba%e9%81%93%e7%be%a4
]]>

Related Posts

云网监控平台如何实现与第三方服务的整合

Lei

April 29, 2025

技术探讨

随着信息技术的飞速发展,云网监控平台在企业网络管理中的重要性日益凸显。为了进一步提升其功能和适用性,云网监控平台与第三方服务的整合成为了一个关键的发展方向。这种整合不仅能够拓展云网监控平台的功能边界,还能为企业提供更全面、高效的网络管理解决方案。 一、接口对接的关键要素 云网监控平台与第三方服务整合的第一步是接口对接。在这个过程中,数据格式的统一是至关重要的。不同的第三方服务可能采用不同的数据格式,例如JSON或者XML。云网监控平台需要能够识别并转换这些格式,以便顺利地接收和处理数据。例如,在与某知名网络安全服务的整合中,该平台开发了专门的数据格式转换模块,成功将其原本复杂的XML格式数据转换为内部统一使用的JSON格式,从而实现了数据的有效对接。 接口的稳定性也是不可忽视的。一个不稳定的接口可能会导致数据传输中断或者错误。云网监控平台在与第三方服务进行接口对接时,需要进行严格的测试。比如,采用压力测试来模拟高并发的情况,确保接口在大量数据传输时依然能够稳定工作。在与一家大型数据存储服务的整合中,通过多轮压力测试,及时发现并修复了接口的性能瓶颈,保证了整合后的服务稳定运行。 二、数据共享与安全机制 数据共享是云网监控平台与第三方服务整合的核心内容之一。一方面,要明确共享数据的范围。云网监控平台需要根据自身的需求和第三方服务的功能,确定哪些数据可以共享。例如,在与一家网络性能分析服务整合时,平台仅共享网络流量和延迟等相关数据,避免了不必要的数据暴露。 数据安全机制的建立是保障整合成功的关键。加密技术是常用的数据安全手段。云网监控平台和第三方服务之间传输的数据应该进行加密处理,防止数据在传输过程中被窃取或者篡改。有研究表明,采用AES加密算法可以有效地提高数据传输的安全性。访问控制也不可或缺。只有经过授权的用户和服务才能访问共享数据,通过设置严格的用户权限和认证机制,确保数据安全。 三、功能互补与协同工作 云网监控平台与第三方服务整合的目的之一是实现功能互补。例如,云网监控平台可能在基础网络指标监控方面表现出色,但在特定应用的性能分析上存在不足。而一些第三方服务专注于特定应用的性能优化。通过整合,两者可以相互补充。以电商平台的网络管理为例,云网监控平台与专注于电商应用性能的第三方服务整合后,能够同时监控网络的基础指标和电商应用的响应时间、交易成功率等关键指标,提升了整体的监控效果。 协同工作是功能互补的延伸。在整合过程中,需要建立有效的协同工作机制。这包括任务分配和协调机制。比如,当发现网络故障时,云网监控平台和第三方服务需要明确各自的职责,是由平台负责基础网络的排查,还是由第三方服务针对特定应用进行问题诊断。通过合理的任务分配,可以提高故障排除的效率。 云网监控平台与第三方服务的整合涉及接口对接、数据共享与安全、功能互补与协同工作等多个方面。接口对接要注重数据格式和接口稳定性;数据共享需明确范围并建立安全机制;功能互补和协同工作能提升整体监控效果。这种整合有助于云网监控平台功能的拓展,为企业提供更优质的网络管理服务。未来,可以进一步研究如何在更复杂的网络环境下优化整合过程,以及如何提升整合后的服务智能化水平。

Read More

云网监控平台如何实现与第三方日志服务的集成

Lei

April 29, 2025

技术探讨

在当今数字化的环境中,云网监控平台对于企业的网络管理和运维至关重要,而第三方日志服务则提供了丰富的日志数据管理与分析能力。将云网监控平台与第三方日志服务集成,能够为企业带来更全面、高效的网络管理解决方案。 一、集成的接口与协议 云网监控平台与第三方日志服务集成首先要考虑的就是接口与协议的适配。许多云网监控平台都提供了标准化的API接口,例如RESTful API。这些接口为与第三方日志服务的交互提供了基础。一方面,通过定义明确的请求和响应格式,云网监控平台可以方便地向第三方日志服务发送数据获取请求。例如,监控平台可以按照API的规范,发送包含特定时间段、日志类型等参数的请求,以获取所需的日志数据。在协议层面,常用的如HTTP协议,确保了数据传输的可靠性。就像[网络技术专家张三在其研究中提到](具体研究出处),良好的接口与协议是实现不同系统集成的第一步,它决定了数据能否准确、高效地在云网监控平台和第三方日志服务之间流动。 安全协议也不容忽视。在数据传输过程中,采用SSL/TLS加密协议,可以保障日志数据的安全性。这不仅防止了数据在传输过程中的泄露风险,还增强了企业对数据隐私保护的信心。因为在当今网络安全形势严峻的情况下,数据泄露可能会给企业带来巨大的损失,如[某企业曾因日志数据泄露导致的安全事件](具体案例出处),所以安全协议的应用是集成过程中的重要环节。 二、数据格式的转换与映射 云网监控平台和第三方日志服务可能采用不同的数据格式。云网监控平台通常会以自己特定的格式存储和管理监控数据,而第三方日志服务也有其自身的数据格式要求。在集成过程中需要进行数据格式的转换。例如,云网监控平台的数据可能以JSON格式存储,而第三方日志服务要求的数据格式为XML。这就需要在两者之间建立转换机制。可以通过编写数据转换脚本或者使用专门的中间件来实现。 数据的映射关系也是关键。不同系统中的数据字段可能代表不同的含义,需要建立准确的映射关系。比如,云网监控平台中的“网络流量峰值”字段,在第三方日志服务中可能对应的是“网络带宽最大值”字段。只有建立了正确的映射关系,才能确保数据在集成后的准确性和可用性。这就好比在不同语言之间进行翻译,准确的词汇映射才能传达正确的信息。 三、日志数据的过滤与筛选 在集成过程中,日志数据的过滤与筛选是提高效率和针对性的重要手段。从云网监控平台的角度来看,由于监控数据量巨大,如果将所有数据都发送到第三方日志服务,不仅会增加网络传输负担,还可能导致第三方日志服务处理效率低下。需要在云网监控平台端对数据进行初步的过滤。例如,对于一些常规的、已知正常的网络监控数据,可以在本地进行简单处理,不发送到第三方日志服务。 而第三方日志服务也可以根据自身的需求进行二次筛选。比如,第三方日志服务可能只对特定类型的网络事件日志感兴趣,如网络攻击相关的日志。通过设置筛选条件,只接收和处理符合条件的日志数据,可以节省资源并提高分析的准确性。这就如同在大海捞针时,先使用一个大网筛去大部分无关的东西,再用一个小网进行更精准的筛选。 四、实时性与异步处理 对于云网监控平台与第三方日志服务的集成,实时性是一个重要考量因素。在某些场景下,如网络安全监控,需要及时将监控到的异常日志发送到第三方日志服务进行分析,以便快速做出响应。这就要求集成系统能够支持实时数据传输机制。例如,可以采用消息队列技术,如RabbitMQ,确保日志数据能够及时到达第三方日志服务。 在一些情况下,实时性并不是唯一的要求,异步处理可以提高系统的整体性能。当网络负载较高或者第三方日志服务处理能力有限时,异步处理可以避免数据传输的阻塞。比如,云网监控平台可以先将日志数据缓存起来,然后按照一定的规则和时间间隔逐步发送到第三方日志服务进行处理。这就像是在交通拥堵时,车辆可以选择合适的时间再出发,而不是都挤在同一时间造成更严重的拥堵。 本文主要探讨了云网监控平台如何实现与第三方日志服务的集成。从接口与协议、数据格式转换与映射、日志数据过滤与筛选以及实时性与异步处理等多个方面进行了详细阐述。通过这些方面的合理处理,可以实现云网监控平台和第三方日志服务的有效集成,为企业提供更强大的网络管理和运维能力。在未来的发展中,随着网络技术的不断进步,云网监控平台和第三方日志服务的集成可能会面临更多的挑战,例如新的数据类型的处理、更高的实时性要求等,这也为相关的研究和开发提供了方向。

Read More