陈天骄, 刘江, 黄韬
北京邮电大学网络与交换技术国家重点实验室,北京 100876
【摘 要】
基于软件定义网络和网络虚拟化,网络编排可以提供快速、高效的差异化业务部署的能力。随着人工智能技术在各领域的广泛应用,网络编排系统与人工智能的结合成为各大运营商和厂商的研究重点。首先介绍了编排系统的概念和各大网络编排开源组织的发展现状;接着在设计态和运行态的架构上引出了基于人工智能的网络编排架构,实现“自动化”到“智能化”的转变;最后对人工智能在编排系统中SDN、NFV和运维方面的应用进行总结,并提出了人工智能在编排系统中未来的发展方向。
【关键词】: 网络编排 ; 人工智能 ; 软件定义网络 ; 网络功能虚拟化 ; 智能运维
【Abstract】
Based on software defined networking and network virtualization,network orchestration can deploy differentiated services quickly and efficiently.With the wide application of artificial intelligence technology,the combination of network orchestration system and artificial intelligence has become the research focus of major operators and manufacturers.Firstly,the concept of network orchestration system and the development status of major open source organizations were introduced.Then,based on the design time and the run time,the network orchestration architecture using artificial intelligence was introduced to realize the transformation from “automation” to “intelligence”.Finally,the application of artificial intelligence in SDN,NFV and operation and maintenance in the orchestration system was summarized,and the future development direction was proposed.
【Key words】: network orchestration ; artificial intelligence ; software defined networking ; tion ; intelligent operation and maintenance
1 引言
随着第五代(5G)系统技术的成熟,网络中的通信速率越来越快,智能设备的数量急剧增加,智能传感网络、大规模移动社交网络和智能交通系统等具有不同要求和特性的新兴服务和应用层出不穷。为了满足不同业务对时延、带宽、功耗、顽健性、安全性等方面的差异化需求,运营商需要在网络中为每个业务部署不同的转发设备、存储设备、传输光纤和网络功能设备,导致业务的部署流程极为复杂。一个业务的开通会消耗大量的人力和物力,部署时间也可能会持续数月。因此,现有运营商的“一刀切”式网络基础架构逐渐僵化,无法跟上新型计算机技术的发展。
为了实现更加灵活的功能部署和服务定制,网络软件化是网络架构发展的主要趋势。SDN (software defined networking,软件定义网络)技术实现了网络二、三层的网络软件化,实现了网络的集中控制。NFV(network function virtualization,网络功能虚拟化)技术实现了 4~7 层的网络软件化,将网络功能与专用的硬件分离,虚拟化为VNF(virtual network function,虚拟网络功能),在网络资源的约束下,将多个VNF和VNF之间的虚拟链路部署到网络物理基础设施上,构成VNF链,提供端到端的差异化网络功能服务。通过软件定义网络和网络功能虚拟化技术,可以在运营商网络基础设施上搭建多个相互隔离的虚拟网络,通过对不同虚拟网络分配不同的网络资源和网络功能中间件,满足不同业务场景对带宽、时延等服务质量的差异化要求。
网络软件化使业务的部署不再受底层硬件设施的限制,但是从收到业务请求到最终完成虚拟化网络的搭建依然是一个需要大量人为干预的流程。为了实现业务部署流程的自动化,越来越多的网络服务提供商开始研究网络编排系统的设计。网络编排通常分为高层业务编排和底层网络资源编排。业务编排将业务部署的工作流程进行规范,再转化为标准化策略下发给底层资源控制器;底层网络资源编排根据业务编排下发的策略,通过北向的标准化接口对业务所需要的网络资源和网络功能进行调配、更新和管理,最终实现业务的部署,同时也将当前的网络状态反馈给业务编排,进行策略的改进。业务编排和网络资源编排相互依赖,形成一套闭环的网络编排系统,实现自动化、定制化业务部署。随着大数据和人工智能技术的发展,网络人工智能成为当前的研究热点,已经有很多研究表明人工智能在SDN管理、NFV编排、网络安全等方面都表现出优异的性能。综合网络中各方面人工智能技术的应用,不断优化编排系统中的策略,使网络编排由“自动化”向“智能化”转变,实现高效、稳定、快速的业务部署。
本文首先介绍了现有网络编排系统的发展情况,然后在现有基于设计态和运行态的编排架构中,嵌入人工智能模块,提出一种基于人工智能的智能化闭环网络编排系统架构,在此基础上,介绍了编排系统中SDN、NFV和运维对人工智能技术的需求,并对人工智能在这 3 个方面中的应用现状做出综述,最后总结了人工智能在编排系统中的未来发展趋势,为基于人工智能的编排系统的进一步完善提供参考。
2 网络编排开源组织发展现状
SDN 和 NFV 技术为现有的网络架构带来了深刻的变革,被认为是未来网络的主要演进方向。面对大量的网络定制化业务的需求,众多运营商试图在传统的运营支撑系统(OSS)中引入这两种技术,实现快速的业务部署和高效的网络运营,降低人力和物力成本。目前,各大运营商都在积极参与开源组织,推进开源网络编排项目的发展。
网络功能虚拟化管理和编排(NFV management and orchestration,NFV MANO)是由欧洲电信标准协会(ETSI)提出的NFV网络编排架构,用于管理和编排包括计算、存储、网络和虚拟机在内的所有网络资源。NFV MANO主要包括3个部分:网络功能虚拟化编排器(network function virtualization orchestrator,NFVO)、虚拟网络功能管理(virtual network function manager,VNFM)和虚拟化基础设施管理(virtual infrastructure manager,VIM)。NFVO 负责网络服务的验证授权、创建和生命周期的管理,实现全局的网络资源的调度;VNFM负责VNF实例的监控与生命周期的管理;VIM负责监控和管理网络中的计算、存储和网络资源,为NFVO和VNFM提供池化的虚拟资源,并对网络中的数据进行采集。NFV MANO的一个重要特性是允许系统组件的灵活接入,组件之间用开放的API和标准化的模板进行交互,实现编排系统的快速迭代和业务的快速部署。基于 NFV MANO 的架构,出现了很多基于设计态和运行态的开源编排项目,其中最有代表性的是开源管理和编排(open source MANO, OSM)和开放式网络自动化平台(open network automation platform,ONAP)。
2016年4月,ETSI开源工作组发布了第一个基于NFV MANO的开源项目OSM。OSM中,设计态模块主要负责网络服务和 VNF 的设计与管理,运行态主要负责网络服务和 VNF 的实例化和管理,实现端到端的编排。在2017年4月至2018年5月间,OSM陆续进行了4个版本的更新,在性能、可扩展性、稳定性和安全性方面做出了重大改进,并实现了单一的全局管理视图,增强了用户体验。2018年5月OSM发布了第五版,该版本开始采用微服务的架构,使新功能模块的加入更加快捷和灵活,同时也将编排的范围从网络功能虚拟化扩展到传输网络和物理网络。第五版的 OSM 可以部署到 5G 场景中,借由编排系统的灵活定制的能力,实现网络即服务(NaaS)。
ONAP是Linux Foundation Networking中的一个开源编排项目,吸引了全球主要运营商和厂商的加入。前身是AT&T主导的ECOMP平台和中国移动主导的Open-O平台,于2017年将这两个项目合并后成立。ONAP同样采用了设计态和运行态的思想,基于模型驱动实现了闭环自动化的流程。ONAP当前发布了3个版本,2017年11月的Amsterdam版本主要合并了ECOMP和Open-O的代码,并提供了虚拟客户端设备、虚拟防火墙和LTE语音服务的3个实例,实现了ONAP的初步使用。2018年6月的Beijing版本加强了平台的稳定性、安全性和可扩展性,并采用微服务架构使平台的大规模部署成为可能。2018 年 12 月, ONAP 发布了 Casablanca 版本,与 OPENFV 的Gambia版本一起提供了支持5G和跨运营商VPN的跨堆栈部署,在互操作性和稳定性方面继续优化。ONAP 的商业生态系统不断扩大,逐渐成为运营商实际可用的网络自动化编排平台。
3 基于人工智能的网络编排系统架构
现有的网络编排系统大多采用设计态和运行态分离的架构,实现了闭环自动化。为了将人工智能技术应用到网络编排中,实现从“自动化”到“智能化”的转变,在设计态和运行态架构的基础上,设计了基于人工智能的编排系统架构,如图1所示。
图1 基于人工智能的编排系统架构
基于人工智能的编排系统为运营商提供一个智能闭环的业务部署系统,按照业务需求,通过模型的实例化快速地进行虚拟网络的搭建,同时对策略的执行进行监测和学习,对模型和策略的设计进行不断的优化,实现高效、顽健的网络编排。编排系统主要分为4个模块:微服务架构实现各组件的灵活部署,设计态实现资源、业务、运维的模型化和策略的生成,运行态实现策略的执行,人工智能模块实现策略的学习和优化。
微服务架构将传统的集成化的服务系统转为组件化的架构,实现系统的松耦合。每个细粒度的系统组件之间互相独立,专注于提供单个服务功能,微服务之间通过通用的 API 进行交互,实现完整的服务流程。网络编排系统的架构包含了模型化、策略设计、网络监测、资源分配、网络功能部署等众多搭载在云平台上的组件,导致系统的管理十分复杂,而细粒度的组件在可扩展性和可维护性方面存在巨大的优势。在编排系统进行开发时,基于标准化的组件接口,各个组件可以独立演进,加快迭代进程。用户在部署业务时,可以选择需要的组件集成到自己的业务中,加快业务部署的速度。
设计态是编排系统的工具库,实现了资源、业务、系统运维的模型化,同时对业务部署的整个流程进行设计,创建标准化的策略。设计态框架可以对资源、业务、系统运维的模型进行复用,避免了对同类业务请求的重复设计,提高了大规模业务的编排效率。同时标准化的策略可以使设计态模块屏蔽运行态系统中的各类控制器的异构性,提高了编排系统的兼容能力。
运行态是网络编排的执行者,对设计态下发的策略按照标准化模板进行解析,进行网络资源和网络功能的分配、迁移、移除,实现业务的实例化。SDN控制实现了网络二、三层的编排,按照策略对网络的计算、存储、网络资源进行分配,通过流量调度对网络状态做进一步的优化。NFV控制器实现了网络功能(如防火墙、DNS等)的编排,按照策略搭建出VNF链,实现端到端的网络功能服务。
人工智能模块是将运行态实时采集的网络数据作为输入,利用各类机器学习技术对网络资源分配、网络流量调度、网络运维等方面的策略进行训练,输出优化的策略对现有系统的运行做出修正。
在微服务架构的基础上,设计态模块根据业务请求生成策略,下发给运行态系统,运行态系统在策略解析后进行业务所需网络的实例化,并将采集到的网络数据导入人工智能模块中进行训练,输出训练结果对控制器的执行进行优化,待训练效果达到稳定之后可以形成模型加入设计态中,循环往复,实现智能化闭环。本系统在自动化闭环中加入了机器学习技术,通过对网络中海量数据进行学习得出优化的策略,为编排系统赋予智能化的大脑。
4 人工智能技术在网络编排中的应用及发展
4.1 SDN编排中的人工智能技术
在网络编排架构中,SDN编排子系统按照解析后的模型化策略,进行网络资源的编排和调度,提供按需定制的网络服务。SDN具有控制平面和数据平面分离的特性,可以利用控制到转发的接口协议对分布式的数据平面设备进行集中的控制。在网络编排智能化的需求下,SDN为人工智能技术在编排系统中的应用带来了极大的便利。一是逻辑集中的SDN可以维护一张全局的网络视图,并实现实时、细粒度的数据采集,为人工智能训练提供了充足的网络状态数据;二是网络可编程的SDN可以进行高效的网络资源分配和流量调度,实现人工智能训练出的优化策略的实时下发。当前,SDN编排中人工智能的研究主要集中于数据平面资源分配、控制平面资源分配和流量调度3个方面。
基于人工智能的数据平面资源分配主要是在满足QoS或QoE的前提下,最大化网络的资源利用率和编排效率。在编排系统中,网络虚拟化可以实现网络资源的虚拟化隔离,使多租户共享一个物理网络,在大多数研究中,数据平面中虚拟网络资源的分配问题被表述为虚拟网络映射(VNE)问题,根据租户对拓扑、CPU、带宽等需求,进行物理网络到虚拟网络的资源分配。参考文献使用马尔可夫决策过程(MDP)框架对VNE中的网络节点选择过程进行建模,并使用蒙特卡罗树搜索算法为MDP设计动作策略,与现有的VNE算法相比,在额外的时间成本的代价下最大化了基础设施提供商的利润。参考文献针对虚拟网络资源分配的速度进行了改进,提出了一种广泛使用的VNE算法加速框架,利用Hopfield神经网络执行有效的搜索空间缩减,从物理网络中提取出较优的子图,将这些子图提供给现有 VNE 算法,可以同时实现更高的资源利用率和更快速的资源分配。参考文献提出了一个基于深度强化学习的多资源集群调度程序,采用标准策略梯度强化学习算法对网络中 CPU 和带宽资源进行训练,不需要任何先前的系统行为知识来学习这些策略,并且根据经验可以保留一些资源为即将到来的短期工作服务,提高资源分配的时间效率和资源利用率。
基于人工智能的控制平面资源分配主要是从更高的层面对控制器进行编排,为数据平面的编排提供更高效、更稳定的控制能力。控制器需要处理他所连接的所有设备的控制流量,需要对控制器进行有限的计算和对带宽资源做出合理的分配。参考文献提出了基于机器学习的管理程序资源的分配策略,利用迭代在线学习方法来确定控制器资源到控制平面消息速率的映射,为不同资源的虚拟环境中实现网络管理程序的动态负载平衡提供了基础。控制器与数据平面设备之间的距离也会影响业务处理效率,因此控制器的编排不仅需要考虑控制器自身的负载能力,还应根据数据平面的设备位置和流量情况对控制器进行合理的位置部署。传统的启发式的控制器放置算法具有较高的计算复杂度,参考文献提出了一种基于监督学习的控制器放置策略,将网络流量分布作为输入,输出一个初始化放置策略给启发式算法使用,节省高达 2/3 的算法运行时间,提高控制器位置编排的效率。
基于人工智能的流量调度主要是通过设置优化的路由策略进行流量路径的规划,实现更低的端到端时延、负载均衡或网络资源利用率的最大化。现有应用较为广泛的最短路径优先算法和启发式路由优化算法分别在网络资源利用率和计算复杂度方面受限,无法充分利用SDN集中控制的优势。基于人工智能的流量调度算法可以通过SDN控制器集中采集的数据进行充分的训练实现业务感知、流量预测和路由优化,实现实时、动态的流量调度。参考文献提出了一个基于业务感知的多径路由算法,使用监督学习算法对流量进行优先级排序,并根据其优先级分配路径,确保高负载网络中高优先级流量路径的可用性。参考文献提出了一种基于长短期记忆的神经网络的流量预测框架,可以在较短时间内实现高精度的流量预测,使控制器可以提前进行路由策略的调整。参考文献提出了基于深度强化学习的路由优化方法,可以根据当前的网络流量状况进行自动的路由优化,减少网络延迟。
4.2 NFV编排中的人工智能技术
网络编排中另外一个重要的方面就是NFV的编排。为了实现更加灵活的功能部署和服务定制, NFV技术将网络功能(NF)与专用硬件分离,虚拟化为虚拟网络功能(VNF),一系列连接的VNF构成VNF链,以满足不同业务场景对带宽、时延等服务质量的差异化要求。现有的基于人工智能的NFV编排技术主要在于资源分配和流量分类调度两个方面。
基于人工智能的NFV资源分配不仅需要考虑网络资源的使用,还要考虑网络功能中间件之前的连接关系和业务需求。参考文献提出了基于分层博弈论的分布式 SDN/NFV 管理系统,VNF请求和服务提供商之间的交互被建模成两阶段的Stackelberg 博弈,服务提供商是博弈的领导者,请求是跟随者,并使用强化学习算法证明博弈可以收敛到唯一的Stackelberg平衡状态,使服务提供商和请求的收益最大化。参考文献提出了面向NFV的云计算资源动态分配方案,利用马尔可夫决策过程考虑长期的影响和所有成本因素做出分配决策,利用贝叶斯学习方法根据资源的历史使用情况预测分配的资源在未来的可靠性,最终实现最优的资源利用率。参考文献利用强化学习进行动态的服务链创建,通过控制器学习每个VNF对虚拟资源的使用,每个物理节点根据学习结果创建合适的VNF,在考虑CPU、内存等资源消耗的情况下搭建高效的服务链。
基于人工智能的NFV流量的分类与调度在已有的网络功能服务链的基础上,进行业务流量的分类与调度,实现网络资源利用率的最大化。参考文献提出了一种基于NFV网络的流量分类方法,通过执行基准测试来评估不同流量分类的监督学习算法的性能,证明NaiveBayes算法在流量分类精度和时间响应之间实现良好平衡。参考文献提出了一种自适应的 NFV 路由优化策略,提出了离线和在线两种学习模型,利用多层前馈神经网络对NFV之间的路由进行持续的学习和优化,从而提高资源利用率和用户的服务质量。
4.3 基于人工智能的安全防护和智能化运维
编排系统采用了 SDN/NFV 的架构来实现对网络的高效编排,但是集中式的网络架构也更容易受到网络攻击的威胁。当前,网络中的恶意攻击变得越来越隐蔽,传统的流量分类技术无法及时地识别层出不穷的新型攻击模式,需要利用机器学习的方法实现动态的恶意流量特征的识别,并制定相应的安全防护措施。
基于人工智能的恶意流量识别通过流量数据的采集和训练,识别出潜在的攻击者。参考文献提出了一种基于隐性马尔可夫模型的网络入侵检测系统,将网络攻击的多个流量特征作为输入进行训练,动态地更新模型,实现类似攻击的模式识别,并标记异常行为,适应不断变化的恶意攻击。在区分正常流量和恶意流量的基础上,对不同攻击模式流量的分类也得到了充分的研究。参考文献提出了一种非对称深度自动编码器(NDAE),采用非监督学习的方法,提出基于深度神经网络和随机森林的分类模型,提高了不同攻击流量分类的精确度并缩短了训练时间。在当前各类网络攻击中,分布式拒绝服务(DDoS)攻击是最流行的一种,它通过发送大量的请求占用网络资源导致网络瘫痪,攻击方式非常简单但是难以防御。参考文献使用卡方检验和基于信息增益的特征选择方法来选择攻击特征,开发Navies Bayes、C4.5、SVM、KNN、K-means和模糊c均值聚类这6种机器学习模型,并进行实验证明模糊c-均值聚类算法可以有效监测DDoS攻击。基于人工智能的安全策略的实施是在恶意流量识别的基础上进行动态的安全规则下发。参考文献使用真实数据来训练 4 种不同的机器学习算法,预测可能受到攻击的主机,根据训练结果,在SDN控制器上定义安全规则,通过阻止整个子网的流量来限制潜在的攻击。
与安全防护相似,基于人工智能的智能化运维技术也是通过对网络中的流量及设备状态进行学习,进行网络故障原因的诊断。参考文献提出了基于SDN的自我诊断架构,利用基于贝叶斯网络的大数据技术,实现了SDN中高准确度的故障诊断。参考文献演示了 SDN 中应用程序的故障对网络的影响,并研究了两个概念案例,使用基于机器学习的异常检测和分析技术识别SDN中的软件故障,并为网络的故障修复提供指导。
5 结束语
网络编排和人工智能技术都是当前、未来网络领域的研究热点。本文总结了当前网络编排的发展现状,在闭环自动化的编排架构中加入了人工智能模块,形成了基于人工智能的编排系统架构,实现了由“自动化”到“智能化”的转变。在编排系统中,归纳了当前人工智能技术在SDN、NFV和系统运维中的研究现状,对基于人工智能的资源分配、流量调度、流量分类等研究成果进行综述。现有基于人工智能的流量分类技术已经可以较好地识别网络的恶意流量和故障信息,但是在此基础上,如何利用人工智能实现网络的自愈依然有很大的研究空间。同时也需意识到,网络编排系统实现的是从业务请求的到来到最终网络服务提供的整个流程,各模块的策略之间会互相影响,单个模块内的人工智能技术的应用无法实现全局的优化,因此利用人工智能技术对网络编排进行整体的优化也是一个非常有价值的研究领域。
[作者简介]
陈天骄(1996.01)男,北京邮电大学博士研究生,主要研究方向为未来网络体系架构,空间信息网络,网络资源调度。
刘江(1983.09)男,博士,北京邮电大学副教授,主要研究方向为未来网络体系架构、网络虚拟化、软件定义网络、信息中心网络等。
黄韬(1980.11)男,博士,北京邮电大学教授,主要研究方向为未来网络体系架构、路由转发、网络虚拟化、软件定义网络等。
声明:本文来自电信科学,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。