当地时间2021年4月18日,加拿大第一大移动通讯网络运营商Rogers Wireless及旗下Fido Solutions发生超大规模断网,形成严峻的社会影响。此次大规模断网事情涉及加拿大全国规模及近千万用户、继续时间长、形成影响大,对Rogers带了巨大的直接经济丢失和直接品牌丢失,对加拿大经济发生了严重负面影响。这也是5G网络有史以来最大的事端。此次事情发生的直接原因是5GC设备商软件晋级,触发隐性软件Bug。经过剖析,该事端的深层次原因是5GC NFV化,带来了核心网云网络黑盒化问题,导致5GC运维技能难度高,毛病定界定责定位难度高,难以发现网元毛病预兆,呈现毛病之后难以快速确认问题界面,难以快速确认毛病源。
跟着CT与IT技能的交融以及5GC NFV化的开展,逐步暴露出IT技能对通讯网络牢靠性的影响。云计算技能可认为通讯网络带来硬件通用化、弹性化、资源池化,事务迭代加快等优点,但原有专用设备的牢靠性、易保护性在新的云架构中面对巨大应战。
在实践的5GC运维进程中,现已暴露出体系“黑盒化”、运维技能难度高、毛病定责定界难、面向事务确保难等一系列应战。
正是因为NFV化带来的网络牢靠性问题和运维确保困难,各大运营商在现阶段只能退而求其次,暂缓5GC三层解耦作业,只推动硬件层解耦,或许硬件层与虚拟层、网元层厂商绑定,由5GC厂商来确保网络运转牢靠性,但实践作业中,5GC厂商在对现网进行运维确保时面对与运营商相同的技能应战和跨技能部门协同的窘境。
DeepFlow是由云杉网络开发,面向云数据中心、用于事务牢靠性确保的一款云网络流量监控运维办理渠道。
DeepFlow根据云原生的软探针流量收集技能、智能流量剖析技能,完成对5GC云资源池硬件层网络接口、虚拟层网络接口、VNF层网络接口的全栈流量收集和剖析,树立5GC网络智能监控剖析渠道。
跨层跨域:硬件层、虚拟化层、容器层全栈流量收集和网络功能剖析,精确、客观反映网元/网络状况,不依赖厂商日志。
秒级定位:智能剖析、相关展示恣意资源点间端到端、逐跳功能目标,完成毛病秒级定界、定责、定位。
运维场景:有用支撑丢包、时延、传输层反常、应用层反常、网络风暴、信令风暴等场景的监控、运维、毛病定位。
2020年在某电信运营商网络云测验资源池进行了DeepFlow体系的布置,纳管宿主机、虚拟机、容器POD、IP,完成对5GC的纳管掩盖和可视化监测剖析。
经过在网络云测验资源池的布置运用,充沛证明了DeepFlow的产品才能,能够翻开5GC云资源池“网络黑盒”,完成对一切5GC网元(VNF)不同层次、不同维度的拓扑可视化及功能目标智能剖析;树立面向宿主机、虚拟机、容器、5GC网元的多维度网络监测视图,树立跨硬件层、虚拟层、网元层的一致可视化监控运维才能,下降各技能专业运维难度;经过跨层的可视化才能,处理了毛病快速定界、定责的难题,快速定位毛病源,提高处理时效;处理事务确保、网元运维、云资源运维、网络运维的协同难题;为5GC云资源池供给针对性的安全观测手法(信令风暴、网络风暴、DDoS进犯、不合法IP拜访等)。
在运用DeepFlow体系对5GC体系进行监控运维进程中,5GC网元(VNF)的监控视图中发现PCF的“DNS反常均值”超出合理规模。
在DeepFlow体系中一键快速切换到PCF的容器POD视图中,发现“cse-etcd-1”的“DNS反常均值”最高,快速确定毛病源在网元容器POD-“cse-etcd-1”,辅导网元运维人员介入处理毛病。
一键快速切换到“cse-etcd-2”的DNS日志视图,发现“cse-etcd-2”的DNS恳求被DNS服务器反应“姓名过错”,快速为PCF事务运维人供给了详细DNS日志用于根因剖析。
经过以上进程能够发现,经过DeepFlow云网络流量监控运维办理渠道,能够快速发现5GC VNF内的反常预兆,分钟级界定出毛病界面发生在5GC VNF层,分钟级确定呈现问题的详细方位在VNF的某个详细容器POD。
在运用DeepFlow体系对5GC体系进行监控运维进程中,5GC网元(VNF)的监控视图中发现PCF的TCP建连失利远高于正常值(在5分钟内累计55.45K个)。
一键快速切换到PCF的容器POD视图中,查看“建连—失利总量”排名,发现“vha-pod211-2”的容器POD反常,快速确定毛病源在网元容器POD-“vha-pod211-2”,辅导PCF网元运维人员介入处理毛病。
一键快速切换到“vha-pod211-2”的流日志视图,能够发现很多的“服务端直接重置”反常,快速为网元运维人供给流量日志用于根因剖析。
经过以上进程能够发现,经过DeepFlow云网络流量监控运维办理渠道,能够快速发现5GC VNF内的反常预兆,分钟级界定出毛病界面发生在5GC VNF层,分钟级确定呈现问题的详细方位在VNF的某个详细容器POD。
在Free5GC树立的一套5GC环境中,运用DeepFlow云网络流量监控运维办理渠道对5GC的全栈流量进行收集和可视化剖析,经过模仿虚拟化层的毛病,在虚拟机接口制作500ms的时延。
经过DeepFlow渠道的全栈功能目标可视化视图,能够一键快速查阅AUSF->
UDM全途径①-③、⑤-⑦接口的HTTP时延峰值、TCP建连客户端时延峰值、TCP建连客户端时延峰值,秒级确定问题方位在接口⑤与接口⑥之间,即UDM的宿主机与虚机间的接口导致时延反常(图8进程2)。
上图虚拟机时延毛病定位进程注1:①AUSF容器接口;②AUSF虚机接口;③AUSF宿主机接口;⑤UDM宿主机接口;⑥UDM虚机接口;⑦UDM容器接口注2:进程3-5表明HTTP时延、TCP建连客户端时延、TCP建连客户端时延的全栈目标图形化解读。
经过以上进程能够发现,经过DeepFlow云网络流量监控运维办理渠道,能够快速发现5GC VNF内的反常预兆,分钟级界定出毛病界面发生在虚拟机层,分钟级确定呈现问题的详细方位在某台虚拟机的某个虚接口。
1、凡本网注明转载:其他(非艾肯家电网)的内容,均转载自其它媒体或企业供稿(包含供稿配图),转载意图在于传递更多信息,不代表本站附和作者观念,本站不对内容的精确性、牢靠性或完整性供给任何明示或暗示的确保。
3、假如发现本站有涉嫌抄袭的内容或许运用了版权图片,请与咱们联络()或发送邮件至,一经查实,本站将马上删去侵权内容或版权图片。艾肯家电网将不承当任何法令及连带责任。