1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 网络工具 > 正文

网络工具

广东电信网络故障:哪里出了问题?

1987web2025-04-21网络工具5

广东电信一线处置,全力进行故障抢修,迅速恢复网络正常。

6月8日下午,广东电信突发网络中断故障,广东全省中国电信移动电话互拨打提示空号。广东电信全力进行故障抢修,自当日16:30起,受影响的用户正逐步恢复,截至6月8日17时50分,广东电信网络运行恢复正常。

针对6月8日下午广东电信突发网络中断故障,8日晚,广东省通信管理局召集广东电信、广东移动、广东联通、广东广电、广东铁塔相关负责人召开网络运行安全紧急调度会。局党组书记、局长蔡立志主持会议,传达了工信部和省委省政府领导批示精神。

会上,广东电信通报了8日下午广东电信突发网络故障及应急处理情况,在工信部和中国电信集团公司的远程指挥下,广东省通信管理局现场指挥,广东电信一线处置,通过紧急采取重启链路等措施,全力进行故障抢修。截至6月8日17时50分,广东电信网络运行恢复正常。

对于故障原因,截至发稿,中国电信没有对外官方通报。据了解,后续会有相关说明。

根据一份故障处理流程工单,网络中断故障发生后,运营商内部初步判断,是LDRA到HDRA之间链路拥塞。链路拥塞原因可能为某设备商的数通设备出现异常,导致数据包重传,引起信令风暴。应急处理方法是在SBC部署流量控制流程,以及将上述设备商的路由器隔离。处理之后,业务逐步恢复。

从这份工单看,此次网络中断故障原因初步判断与核心网关键网元之间的协议路由器拥塞,导致信令中断相关。DRA(Diameter Routing Agent,Diameter)是核心网的关键网元之一,是信令网中的信令路由中枢,负责核心网中Diameter信令的转接和路由。

从世界范围看,目前运营商的网络故障多与核心路由器有关,2020年美国互联网服务提供商CenturyLink数据中心的错误配置导致多个网站受到影响,2022年日本、加拿大先后发生的两起重大通信故障也与此相关。

核心路由器又称骨干路由器,是位于网络中心的路由器,而作为整个网络的交通枢纽,运营商的核心路由器需要承担最重的信息转发任务,在性能、速度、延迟等方面要求颇高,任何一个环节的缺陷都可能带来难以估量的风险。

而对于设备商来说,核心路由器领域一直是IP领域的技术制高点,是厂商技术底蕴和研发实力的集中体现。在国内运营商路由器市场中,最早思科、上海诺基亚贝尔占据主导,在近十年间的快速发展,以华为、新华三、中兴为代表的国内厂商逐步成为了市场主角。

去年7月2日,日本运营商KDDI的移动网络发生大规模通信故障,全日本约3915万手机用户无法正常通信,作为日本第二大移动运营商,此次KDDI通信故障几乎是其全部移动用户断网,同时,事故还造成部分银行自动取款机、铁路货运的物流信息系统也受到影响,引发物流迟滞,邮件和包裹投递可能出现延误。

时隔仅一周,加拿大最大电信运营商之一罗杰斯电讯公司(Rogers)于当地时间7月8日凌晨,也发生了重大网络故障,此次网络故障造成国内数百万用户无法上网、打电话。另外,加拿大电子转账系统Interac无法使用,多伦多和弗雷德里克顿等城市的罗杰斯用户甚至无法拨打911;连接爱德华王子岛与大陆的联邦大桥无法处理借记卡付款;许多银行和金融机构的网络出现故障;渥太华公交局的一些电话服务停止;CBC在安大略省基奇纳市的电台停播。

通信故障原因,KDDI官方称是在通信设备维护期间,将语音转换为数据的交换设备器发生了故障,为了减少系统的负载,限制了数据分布进而导致大面积通信故障发生,而割接过程的失败成为这次通信故障的主要原因;Rogers的故障原因是正在对核心网络进行更新升级,在此过程中引发路由器出现故障,网络中涉及大量的软件和硬件,最终,在断开某些特定设备的连接并重新定向了流量后,网络和服务恢复正常。

回看两起国外重大通信故障事件,无不是与核心路由器紧密相关,在以数据为主要承载的软件通信网,核心路由器是重大风险点。

通常来看,核心路由器割接失败的主要原因通常有三点,一是新的核心路由器本身存在故障问题;二是割接准备工作不充分,比如割接前没有进行模拟测试,验证割接方案的可行性;三是在割接过程中出现了操作失误。

因此,相关专家也提出四方面建议,一是对网络进行升级和割接等维护时应该安排在网络闲时进行,并且要做好充分的准备工作,将有可能出现的断网等影响降到最低。二是要适当增加成本,确保网络有足够的冗余和备份机制,包括核心网、传输网、接入网等。三是要提升网络运维的智能化水平,依靠大数据和智能算法,实现主动预防性运维,提升网络运行质量,使能高效运维。四是高度重视核心网的安全运行,核心网相对于承载网和接入网是整个通信网络中的中枢和大脑,一旦出现问题将影响整个网络,需要不断推动核心网架构的迭代升级,向架构简单、运维方便、智能开放、安全可靠和低成本为目标的智简网络演进。

在广东省通信管理局召开的网络运行安全紧急调度会上,蔡立志局长强调,电信网络是重要信息基础设施,关系国计民生,与社会生活和生产经营息息相关,全行业要高度重视电信网络运行安全。广东电信要深入查明原因,做好后续处置,加强网络运行保障。各企业要举一反三,立即组织开展网络安全运行隐患排查整改,结合近期高温、台风天气,启动应急响应系统,密切跟踪网络运行情况,确保网络安全稳定运行

采写:赵妍

采访支持:博文

编辑、校对:博文

软肋的脆弱:两次重大通信事故启示什么?