机器学习理论是研究计算机如何模仿人类的学习行为,获取新的知识或经验,并重新组织已有的知识结构,提高自身表现的理论。
以深度学习为代表的机器学习是当前最接近人类大脑的智能学习方法和认知过程,充分借鉴了人脑的多分层结构、神经元的连接交互、分布式稀疏存储和表征信息的逐层分析处理机制,自适应、自学习的强大并行信息处理能力,可以通过计算机在海量数据中学习数据的规律和模式,从中挖掘出潜在信息,广泛用于解决分类、回归、聚类等问题。
机器学习的研究焦点
机器学习理论研究可以追溯到20世纪40年代对人工神经网络的研究,经过几轮研究热潮,陆续发展出感知器、符号主义与机器推理、神经网络、支持向量机、深度学习等研究热点,构建成较为完整的理论体系,如图1所示。
图1:机器学习基本构成
目前,深度神经网络由于在语音、图像等数据集上取得的性能突破,已成为机器学习领域最受关注的模型之一,从技术内容来看,针对实际应用的局限,机器学习的研究焦点主要包括:
①生成对抗网络,研究者采用引入正则项结合自编码器,使用Wasserstein最优传输距离作为分布度量准则等方式实现了更好地逼近训练数据的分布;
②神经网络鲁棒性,研究者对神经网络的攻守都进行了研究,通过将对抗样本加入训练过程、引入间隔最大化等正则项方法,以及在图像等特定领域使用低通滤波等手段,在一定程度上增强了神经网络鲁棒性;
③元学习,关注如何提取有效的领域特征,同时学习“平均模型” 也受到很大的关注;
④自动机器学习,研究主要集中在模型搜索方面,特别是深度神经网络模型、网络结构搜索成为关注焦点;
⑤图神经网络,图的嵌入、图的生成学习成为研究热点。
智能科技水平评估
①文献评估。查表1可知,机器学习理论相关文献发表众多,文献数量在智能科技谱系基础理论领域排名第一,反映出机器学习理论研究热度高,研究充分;
表1:智能科技 “基、 核、 关” 谱系文献分布数
②国内外发展对比。参考中科院编写的 «中国信息领域2030技术预见» (德尔菲法) 及美国知名信息技术研究和分析机构Gartner公司于2017年技术成熟度曲线模型 (如图2所示,机器学习预计2-5年实现大规模使用,取3.5年) 对国内外机器学习理论发展进行预见分析 (表2),可以看出在机器学习理论方面,美国和欧盟各国处于领先地位,预计其实现技术成熟比中国领先2年;
图2:Garter公司2017年技术成熟度曲线模型
表2:国内外机器学习理论发展预见
③智能科技前景评估。查表3可知,机器学习理论前景是颠覆性的,全球主要技术强国及地区都强调其发展;
表3:智能科技前景评估模型
④智能科技应用紧迫性评估。查表4可知,目前机器学习理论正处于衰退期,近期应用紧迫性一般。
表4:各智能科技发展阶段及应用紧迫性
典型军事应用方向
典型军事应用方向:通信对抗,现代高技术战争中,通信对抗方式出现了各军兵种联合作战数据异构性强,手段多样化导致装备种类复杂及操作难度加大,战争节奏加快使得电磁态势快速变化等新特点。
面对新特点,机器学习提供了新的解决方案。
在各军兵种联合作战方面,机器学习可以集成规范化的操作流程,以流水线的方式实现对不同数据的标准化与规则化,并可以实现不同维度的数据信息相互转化。
在多样化的对抗手段中,通过机器学习模型减少装备的人为干预成分,降低了人为失误概率和训练难度,可以有效提升人机结合能力。
在快速变化的电磁态势中,历史数据训练的机器学习模型可以通过对比,迅速识别异常情况并及时发出预警,有助于决策层提高战场反应能力,机器学习方法可以提高通信对抗的感知能力。
机器学习亟待解决的技术难题
机器学习亟待解决的技术难题包括:
①弱监督学习。监督学习任务需要大量的标记训练数据,深度学习为训练更大的神经网络模型需要更多标记数据,然而由于许多任务中数据标记过程成本过高,难以获得强监督信息;
②开放动态环境元学习。虽然元学习的目标是实现模型、经验的跨环境复用,但现有方法在环境特征的提取、特征的利用方面还存在诸多不足,往往只适用于环境变化有限的条件下,平均模型只能实现提供较好起点的作用,没有解决如何有针对性地复用经验等问题;
③鲁棒机器学习。研究表明神经网络模型易攻难守,并且对于实现鲁棒学习模型缺乏能够提供一般性指导的基本原理;
④真实环境强化学习。由于强化学习十分依赖低成本的采样,几乎只能应用于游戏环境,难以适应开放动态环境下的应用;
⑤富知识机器学习。目前,基于统计原理的机器学习方法,由于缺少领域知识和常识,无法承担设计知识库的任务。虽然从20世纪80年代开始人们就往计算机中输入知识,形成知识库,但离散的知识库很难应用于擅长连续任务的神经网络模型;
⑥非可微学习模型。深度神经网络每一层由可微函数构成,可微使得深度神经网络可以基于梯度下降方法有效优化其权重,方便学习,但可微也导致了很多缺陷,如在表格数据集上深度神经网络的性能往往不如基于决策树的非可微模型。
机器学习理论未来发展趋势
机器学习理论未来发展趋势主要包括:
①机器学习研究从封闭静态转变为在开放动态环境进行研究,逐步突破经典条件限制;
②集中式机器学习向大规模并行和分布式机器学习方向发展,实现将机器学习中的各种统计资源与经典的时间和空间计算资源相结合。
免责声明
文章内容有引自同行作者文献,系作者个人观点,文章观点不代表本机构立场。图片均来自于网络。如有任何异议,欢迎联系我们!
声明:本文来自稻香湖下午茶,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。