众所周知,移动通信网络目前已成为像水、电、气一样的社会基础设施,一旦出现重大故障,就会对人们的日常生活和生产造成巨大影响。当前,全球5G网络处在快速部署的阶段,5G对于各产业数字化升级中的作用更为明显,在这一背景下,网络的稳定、可靠性就显得尤为重要。
网络中断事故时有发生,很多是人为原因造成的
KDDI本次断网从上周六凌晨一直持续到本周一早上,除了影响了数千万手机用户外,多个行业的正常经营也受到影响,日本首相对此专门批示。
根据公开报道,本次受到影响的包括面向物流、金融、交通的线路达100多万条,大量物流货运状态系统信息无法更新,多家银行ATM机无法使用,很多公交卡、车联网服务无法使用。此外,断网也影响了气象服务,日本约1300个气象观测点有接近4成瘫痪,在台风逐渐逼近情况下,气象数据无法更新,给民众造成不小恐慌。
KDDI将此次网络中断事故归咎于“设备故障”,称在设备定期维护的过程中,公司员工们更换核心网的路由器,出现了一个错误,导致无法接通电话,为了改善和修复,进行了进一步的操作,导致发生了连锁多起故障,最终导致有史以来最大的网络中断。日本相关法律规定,如果通信服务“完全不可用”的时间达到24小时或更长时间,则将向用户支付损害赔偿金,媒体估计本次赔偿金额达到200亿日元。
网络中断的严重事故近年来时有发生。就在去年10月份,日本最大的移动通信运营商NTT DOCOMO突然发生全国性移动网络中断的故障,造成其3G/4G/5G网络不可用,有200万人受到影响。直接带来的结果是网课被迫停课、智能手机支付失效等,给日常生活带来了极大的不便。
而这次本来是一次简单的升级替换,准备替换存储20万台物联网终端设备的用户和位置信息的服务器,在这个过程中出现了问题,操作人员启动了回退操作,重新倒回到旧设备,不过却引发了大量物联网终端向旧服务器重新发起位置注册信息,形成信令风暴迅速引发网络拥塞。
去年4月,加拿大第一大移动通信网络运营商Rogers Wireless也发生了超过24小时的超大规模断网,近千万用户受到影响,有观点甚至认为此次断网对加拿大经济产生了重大负面影响。从该运营商发布的声明看来,此次断网的主要原因在于爱立信最近所进行的软件更新,业界分析Rogers的核心网已经实现了基于NFV的软硬件解耦,在网络云化和功能虚拟化后,复杂性从此前的硬件转移到了软件,因此核心网软件的不当更新会导致全网的故障。
国内运营商也出现过部分地区网络中断的故障,不过所涉及的地区和用户规模不大,且在短时间内实现恢复。
诸如地震、洪水等不可抗力容易造成网络中断故障,但很多情况下,网络中断是因为人为的操作引起的,这种情况下很难让用户和监管部门接受,严重情况下会背负绝赔偿,并导致品牌形象受损。
5G时代,网络中断会带来更为重大的损失
网络中断的故障一直伴随着移动通信的发展,在整个经济社会对通信基础设施的依赖程度不断提升的背景下,此类重大故障对于人们生产生活的负面影响越来越大。
在数十年前,当电话或手机还不是生活中标配的时候,网络中断较为常见,人们对断网的容忍度很高。随着移动通信的发展,手机成为普及设备,且成为人们每天生活工作中必不可少的设备时,人们对断网的容忍度越来越低。试想一下,在当前的环境下,有多少人可以忍受24小时处于失联状态?
当然,在技术不断进步的情况下,网络中断的重大故障发生概率已经非常微小,在公众手机用户应用之外,各行业一些场景也对移动通信产生一定的信任,使各行业对通信网络的依赖度不断提升,移动通信网络成为赋能各行业的重要工具。
这一状况进一步发展,移动通信网络成为行业数字化的基础设施,但同时网络的故障带来的负面影响更大。我们看到,日本KDDI和NTT DOCOMO两次重大事故,除了影响手机用户外,还对很多行业物联网连接造成重大影响,甚至造成致命影响。
工信部数据显示,截至今年5月末,三家基础电信企业发展蜂窝物联网终端用户15.9亿户,比上年末净增1.96亿户。蜂窝物联网终端用户规模占移动网终端连接数的比重已达49%。可见,物联网连接正在高速增长,很快将成为移动通信网络连接的主力。而这些物联网连接大多分布于各行业应用中,因而未来也将成为网络故障造成负面的主要领域。
另外,5G更大的价值在于赋能千行百业数字化应用的观点已深入人心,业界认为未来5G网络的应用场景中80%是行业应用,个人应用仅20%。如果说此前运营商的断网大部分影响在于手机用户,那么未来5G规模化商用后,断网的重大事故则会对各行各业正常生产经营造成中断,届时会形成更为恶劣的影响。
众所周知,国内5G正式商用超过3年时间,过去3年5G应用的主战场放到了行业应用上,以超乎预期的速度拓展商用场景,大踏步迈入规模化应用关键期。目前,5G行业应用案例已累计超过2万个,覆盖40个国民经济大类,尤其是在工业制造、采矿、港口等垂直行业应用场景加速规模落地,已由最初的生产辅助类业务为主向设备控制、质量管控等核心业务拓展,是当前5G应用方案较为成熟的领域。
各行业的高清视频、智能检测、移动巡检、远程控制、辅助作业、人机互动、精准定位等应用场景背后都有5G的助力,而这些场景是行业生产经营的核心流程,可以说5G将大量物联网连接深入嵌入到各行业生产经营过程中,因此网络的可靠性、稳定性对于各行业来说至关重要。
以5G+智慧急救为例,在5G的辅助下,病人在被送上急救车的那一刻,医护人员就可以利用5G医疗设备完成一系列基础检查,并通过5G网络将医学影像、病人体征、病情等关键信息实时传输到医院,院前院内无缝衔接,及时做好术前准备。此前,传统急救无法做到“上车即入院”,但在5G加持下这一愿望可以实现,继而成为急救行业的一个常态化模式,在这种情况下,若网络突然中断,让已普及的“上车即入院”模式无法实现,严重情况下可能造成致命的医疗事故。
在5G网络稳定性、可靠性方面,近年来业界对于5G网络“云化”形成广泛讨论,尤其是对于核心网云化部署引起的重大故障担忧。例如,此前多家云计算巨头发布5G网络解决方案,其中一个典型的特点就是将核心网部署在公有云上,降低了部署成本和落地门槛,更有一些主流运营商计划加速网络功能虚拟化的进程。然而,承担了通信控制、用户管理、切片编排、转发等功能的核心网是5G网络中的“大脑”,出现故障后导致大面积瘫痪的概率很大。
针对网络中断的重大故障,业界从多方面提出建议,例如加强冗余备份、建立完善的管理制度和法规,以确保网络的可靠性和稳定性。当然,网络的可靠性与稳定性是一个持续改进优化的过程,也需要平衡投入和成本,逐渐推动网络重大故障概率进一步降低。