摘 要:针对目前隐蔽通信技术抗干扰能力弱、承载信息量少、抗隐写分析能力差的问题,提出了一种基于多维码技术的隐蔽信息传输方法。具体而言,提出了一种时间维度的多维码作为秘密信息的载体,以提高通信中秘密信息的抗干扰能力,以及一种“嵌入载体式”和“映射关系式”相融合的面向视频媒体的多维码隐写方法,以实现数据的隐蔽传输。大量实验证明,该隐蔽信息传输方法具有较强的抗高斯噪声和泊松噪声干扰的能力,承载的信息量为现有无载体隐写方法的 100 倍,抗隐写分析能力提升为原来的 6.5 倍。
内容目录:
1 研究现状
2 隐蔽通信方法
2.1 基于分节信息的多维码构建
2.2 嵌入载体式隐写
2.3 映射关系式隐写
2.4 通信架构设计
3 实验评估
3.1 实验目的
3.2 抗干扰能力评估
3.3 承载信息量评估
3.4 抗隐写分析能力评估
3.5 隐蔽通信性能评估
3.6 实验结果与分析
4 结 语
随着网络通信技术的不断演进,信息安全问题逐渐受到人们的重视,隐蔽通信技术也得到了迅猛发展。隐蔽通信是一种在不违反系统安全策略的前提下,允许信息在两个或多个通信方之间传输的方式,与其他通信方式相比,隐蔽通信更具有抗审查和难以被发现的特点 。隐蔽通信是信息隐藏的重要分支之一,在隐蔽通信中,两个通信方可以基于系统安全策略相互合作,使用信息隐藏技术将难以察觉的信息嵌入合法的信息内容中进行传输。
隐蔽通信技术具有高度的安全性和大隐藏容量的特点。高度的安全性主要表现在普通用户无法察觉到的隐藏过程,同时攻击者在统计上也难以区分隐藏信息与载体本身的特征;大隐藏容量指的是多媒体载体可承载的秘密信息大小,即秘密信息与载体信息的大小比例,大小之比越大越好。
近年来,基于隐写术的隐蔽通信技术在多媒体载体中有着广泛的应用。隐写术指的是一种将秘密信息嵌入表面上看似正常的数字载体中,例如静态图像、数字音频和视频信号等。隐写术不会影响载体信号的视觉、听觉效果,从而使得秘密信息可以以不为人知的方式进行传输。
本文的应用背景是在视频中隐写入信息,使得在传输视频时,信息可以被秘密地传输。目前,以视频作为隐写载体进行隐蔽通信的方法有 2022 年 Hacimurtazaoglu 等人提出的一种基于最低有效位(Least Significant Bit,LSB)的视频隐写应用程序,2020 年 Li 等人 提出的隐写极坐标编码的自适应隐写框架,2017 年 You等人提出的替换 CAVLC 编码中符号和码字的熵编码视频隐写算法。然而,Hacimurtazaoglu 等人 的方法抗隐写分析能力差,Li 等人的方法抗干扰能力弱,You 等人的方法承载信息量少。因此,针对以视频作为隐写载体进行的隐蔽通信存在抗干扰能力弱、承载信息量少、抗隐写分析能力差的问题。首先,本文调研了隐写技术近年来的研究现状,比较分析了各种隐写技术的优缺点,提出了⼀种时间维度的多维码生成技术,该多维码具有很强的抗干扰能力。其次,利用多维码快速便捷的特点,提出了一套基于分节码的隐蔽通信架构:对于分节码,使用“嵌入载体式隐写”方式隐写入分节信息生成的多维码;对于秘密信息,使用“映射关系式隐写”方式。该隐蔽通信架构较好地解决了传统隐蔽通信抗干扰能力弱、承载信息量少、抗隐写分析能力差的问题。
1 研究现状
目前,基于深度学习的隐写技术在隐蔽通信中应用广泛,ASDL-GAN 模型 通过网络之间的交替对抗训练,实现秘密信息自适应嵌入;SPAR_RL 模型 使用网络的交替迭代训练,实现秘密信息像素级嵌入;ADE-EMB 模型 通过修改方向与梯度的逆符号相同,提高模型的抗隐写分析能力。基于深度学习的隐写模型分为4 种类型,分别是嵌入载体式隐写模型、生成载体式隐写模型 、合成载体式隐写模型 、映射关系式隐写模型 。
(1)嵌入载体式隐写模型:利用深度学习算法在已有的载体图像上直接或间接实现信息的隐藏。其优点在于承载信息量大、安全性高;缺点是载体图像的改动痕迹较大。代表性的模型有SteganoGAN、ADV-EMB、Deep Steganography、ASDL-GAN、HiDDeN等。
(2)生成载体式隐写模型:利用深度学习中的生成模型生成更加适合隐写的载体图像,并结合传统的隐写算法来隐藏信息。其优点在于融合了深度学习技术来提高隐写性能,同时也利用了传统的隐写算法;缺点是由于生成的载体图像并不真实,其隐写安全性可能会受到一定程度的影响。代表性的模型有 SGAN、SSGAN 等。
(3)合成载体式隐写模型:利用深度学习算法在自然载体图像上进行修改,并在修改后的图像上隐藏秘密信息。其优点在于通信的接收方可以提取全部的秘密信息;缺点是接收方在提取秘密信息时,需要知道先验信息。代表性的模型有 SGSRGAN、Liu’s model等。
(4)映射关系式隐写模型:建立秘密信息与多媒体载体特征之间的映射关系,利用深度学习算法进行信息隐藏。其优点在于没有修改已有的载体图像;缺点是承载信息量少。代表性的模型有 Meng’s model、Zhang’s model等。
以上 4 种隐写技术各具优缺点,由于本文是以已有的视频为载体进行隐蔽通信,不能使用生成载体式隐写模型生成适合隐写的载体图像,也不便使用合成载体式隐写模型传输先验信息。因此,本文充分结合嵌入载体式隐写模型和映射关系式隐写模型的优点,提出了一套基于分节码的隐蔽通信架构。
2 隐蔽通信方法
在对分节码的通信架构进行描述之前,先介绍本文隐蔽通信方法的设计动机。由于本文设定的秘密信息的载体为视频媒体,因此秘密信息在视频帧中的隐写顺序格外重要。简单的顺序隐写往往会使得秘密信息被较为容易地破解,因此本文提出一种基于分节码的乱序视频隐写方法。具体如图 1 所示,本文将视频图片分成 N 节用于隐写,每一节有 N 帧图片,将分节信息隐写入第一帧图片中(例如秘密信息对应的视频帧位置、隐写时使用的映射关系、下一节视频的首帧位置等)后称为“分节码”,并将秘密信息乱序隐写入剩下的图片中。因此,即使攻击者对视频进行分析,也难以获得真正引入秘密信息的视频帧,同时由于视频帧的乱序存放,攻击者难以破获隐写内容。为了达到隐蔽通信的目的,对于重要性高的秘密信息,采用“映射关系式隐写”方式隐写入载体;对于信息量大的分节信息,先将分节信息转化为多维码,再使用“嵌入载体式隐写”方式将多维码隐写入载体。
图 1 隐蔽通信系统
本章节将分别对算法中涉及的基于分节信息的多维码构建、嵌入载体式隐写、映射关系式隐写进行介绍,最后总结整体的通信架构。
2.1 基于分节信息的多维码构建
传统的隐蔽通信网络没有纠错能力,如果直接传输分节信息,则系统在受到攻击或噪声污染时容易造成分节信息无法完整传递至接收方或接收方收到的信息可读性差等问题。然而二维码具有很好的抗噪声干扰能力,若能将分节信息加密编码为二维码后再传输,那么在传输过程中,上述问题就能得到一定程度的改善。
分节信息包含本节秘密信息的映射规则、本节秘密信息的排列顺序、下一节分节码的位置,同时隐写载体为彩色视频,本文在二维码上增加了 RGB 维度,视频帧的 R 通道隐写入本节秘密信息的映射规则生成的二维码,视频帧的 G 通道隐写入本节秘密信息的排列顺序,视频帧的 B 通道隐写入下一节分节码的位置。并且视频为时间上连续的彩色图像帧,完整视频中可以按照时间顺序隐写每一节的分节信息,在二维码增加了 RGB 维度的基础上,又增加了时间维度,即一种时间维度的多维码,该多维码具有抗噪能力强的特点。值得注意的是,这里的二维码并不限定何种二维码生成方式,因此二维码的生成方式在此不再赘述。接下来,主要以传统的快速响应(Quick Response,QR)码生成方式为例进行阐述。
传 统 的 QR 码 通 过 里 德 - 所 罗 门(Reed Solomon,RS)码进行纠错。RS 码具有很强的纠错能力,同时具有方便构造、编码简单、实用性强的特点,被广泛用于实时性要求较高的数字通信中。RS 码根据已定标准可划分为 4 个纠错等级,使用者可以根据实际情况的需求选择不同纠错能力等级的 RS 纠错码,其分别为 L 级(可修正 7% 的码字)、M 级(可修正 15% 的码字)、Q 级(可修正 25% 的码字)、H 级(可修正 30% 的码字),即等级越高的 RS 纠错码编入 QR 码时的重复次数越多,而高容差率的QR 码带来的负面效应是高冗余的编码。本文采用 H 纠错级别的 QR 码对分节信息进行编码,保证其有高容错率和冗余。
2.2 嵌入载体式隐写
对于分节码使用的是嵌入式载体隐写,值得注意的是,这里的隐写算法并不限定何种隐写方法,下面以 LSB 隐写算法为例进行讲解。
LSB 为最低有效位,即数字流中最后一位,二进制中最小的比特。LSB 隐写即最低有效位隐写算法,根据分节信息修改彩图 RGB 通道数值的最低有效位,其他高位数值保持不变,人眼无法区分彩图修改前后的变化,从而实现分节信息的隐写。
为了提高分节码的抗隐写分析能力,采用隐写分析模型对嵌入式隐写后的图片进行隐写分析,挑选出抗隐写分析能力强的图片作为载体,此处以 LSB 隐写算法为例进行讲解。
嵌入载体式隐写流程如图 2 所示,首先使用噪声随机生成二维码,并挑选足球比赛的录像视频作为自然载体,将随机生成的二维码隐写 入 足 球 比 赛 的 录 像 视 频 中。使 用 Srnet、Xunet、Spam3 个隐写分析模型进行隐写分析,其中,Spam 是传统的隐写分析模型,Xunet和 Srnet 是深度学习的隐写分析模型。先输入隐写了随机二维码的单通道图像训练 Xunet 和Srnet,再使用 Spam 和训练好的 Xunet、Srnet 模型进行隐写分析的测试。测试集一共包含 3 582张隐写了二维码的载体图像,被 Spam 隐写分析出的概率是 96.371%,被 Srnet 隐写分析出的概率是 99.945%,被 Xunet 隐写分析出的概率是 88.359%,其中被隐写分析出的概率定义为被隐写分析出的载体图像数量与参与隐写分析的载体图像的总数量之比。由此可见,隐写了二维码的载体图像被隐写分析出的概率很高,因此本文挑选出不能被 3 个隐写分析模型都隐写分析出的图像作为隐写的载体并进行后续的算法。
图 2 嵌入载体式隐写流程
2.3 映射关系式隐写
对于秘密信息使用的是映射关系式隐写方式,映射关系式隐写方式又称为无载体隐写,是建立秘密信息与多媒体载体特征的映射关系,利用深度学习方法进行秘密信息的隐藏。由于“映射关系式隐写”没有对载体图像进行修改,含密对象和自然不含密载体图像完全相同,因此“映射关系式隐写”方式比生成、嵌入、合成图像载体的隐写方式具有更好的抗隐写分析能力,很难被隐写分析模型分析出来。
“映射关系式隐写”方式有 3 种:“含密对象搜索式方法”“含密对象生成式方法”和“含密行为构造式方法”。其中,“含密对象搜索式方法”是先建立秘密信息与自然载体图像特征之间的映射关系,再按照映射关系挑选出秘密信息对应的合适自然载体图像,从而传递秘密信息。“含密对象生成式方法”是先将秘密信息设置为图像载体生成模型生成图像的约束条件,再通过图像载体生成模型生成含密图像。“含密行为构造式方法”是先将秘密信息设置为行为构造模型构造行为的约束条件,再通过行为构造模型构造出含有秘密信息的行为。
本文使用现有的录像视频作为信息载体,故无法使用“含密对象生成式方法”和“含密行为构造式方法”,只能使用“含密对象搜索式方法”进行“无载体隐写”。
在选择载体图像特征时,高层语义比像素值等图像特征具有更好的噪声鲁棒性,更适合作为载体图像特征。目标检测模型 YOLOv5 可以同时检测多个类别和多个物体,输出的数据为前向传播后进行非极大值抑制处理的结果,一个目标对应一个 1×6 的张量,若将其直接作为载体图像特征,所能承载的信息量太少。
在本文中,选取 YOLOv5 前向传播的结果作为无载体隐写中映射的图像特征,其具有一定的噪声鲁棒性,YOLOv5 有 4 种网络结构,分别是YOLOv5s、YOLO5m、YOLOv5l 和 YOLOv5x,每种网络结构的模型大小不同,前向传播后的张量大小也不同。本文使用的是 YOLOv5l 网络,网络的前向传播结果为 1×25 200×85 的张量,一共有 2 142 000 个数值用于映射秘密信息,秘密信息与图像数值特征映射关系实例如表 1 所示。例如,某一节序号为 1 的图像前向传播结果中第 2 个数据为 0.8237,序号为 2 的图像前向传播结果中第 1 个数据为 1.9465,在该节的分节码中制定映射规则 0.8237 对应“我”,1.9465对应“是”,则分节码中秘密信息“我”对应的序号为 1-2,“是”对应的序号为 2-1。
表 1 秘密信息与图像数值特征映射关系实例
2.4 通信架构设计
本文将信息隐写入完整的视频中,包含秘密信息和分节码,通信架构设计如图 3 所示。秘密信息是通信内容,即通信的重要信息,要保证其安全性。分节码包含这一节中秘密信息“映射关系式隐写”的映射规则、秘密信息的排列序号和下一节分节码的位置。通信的发送方先将秘密信息和图像特征进行映射,再按照秘密信息的顺序对图像特征进行排序,把每一节的隐写映射规则和秘密信息排列序号隐写入该节的第一张图片生成分节码,最后对完整视频进行传输。接收方接收视频后,先按照分节码中秘密信息的排列顺序对图片特征进行排序,再按照隐写映射规则将图像特征恢复成秘密信息,最后成功获取秘密信息。为了提高通信的安全性,在每一节中,图像特征和秘密信息的映射规则在分节码中重新定义。
图 3 通信架构设计
3 实验评估
3.1 实验目的
针对隐蔽通信目前存在的抗干扰能力弱、承载信息量少、抗隐写分析能力差的问题,测试本文中提出的分节码“嵌入载体式隐写模型”和秘密信息“映射关系式隐写模型”的抗干扰能力、承载信息量能力和抗隐写分析能力以及隐蔽通信性能评估。
3.2 抗干扰能力评估
在分节码的“嵌入载体式隐写模型”中隐写入的是多维码,多维码是增加了时间维度和RGB 维度的二维码,具有极强的抗干扰能力,并且在本实验中采用 H 纠错级别的 QR 码,可以修正 30% 的码字,只要二维码有一部分正确就可以解码出正确信息。因此,抗干扰能力的实验主要针对秘密信息的“映射关系式隐写模型”。
在秘密信息“映射关系式隐写模型”的抗干扰能力实验中,对图像进行如下类型的攻击:
(1)均值 μ 为 0、标准差 σ 为 0.05 的高斯噪声;
(2)均值μ为 0、标准差σ为 0.1 的高斯噪声;
(3)均值μ为 0、标准差σ为 0.5 的高斯噪声;
(4)均值 μ 为 0、标准差 σ 为 1 的高斯噪声;
(5)均值 λ 为 2 的泊松噪声;
(6)均值 λ 为 5 的泊松噪声。
将噪声攻击前后的图像分别送入模型中,根据噪声攻击后图像特征的平均改变比例来衡量算法的抗干扰能力,如式(1):
式中:为未受到噪声攻击时图像特征的数值;为受到噪声攻击时图像特征的数值;N 为参与计算的图像特征数量。目标检测模型 YOLOv5前向传播的结果作为无载体隐写中映射图像特征的抗干扰能力如表 2 所示。由表 2 可知,均值为 0、标准差为 0.05 高斯噪声和均值为 0、标准差为 0.1 高斯噪声均不会对 YOLOv5 前向传播的结果产生干扰,YOLOv5 抗高斯噪声和泊松噪声干扰的能力很强,即秘密信息也具有很好的抗干扰能力。
表 2 抗干扰能力
3.3 承载信息量评估
在分节码的“嵌入载体式隐写模型”中,先将分节信息转化为多维码,对于版本 40、纠错 级 别 为 Level H 的 QR 码, 固 定 数 据 容 量 为10 208,可以存储 3 057 个纯数字、1 852 个纯字母、1 273 个字节数据、784 个汉字,由此可见,分节码“嵌入载体式隐写模型”的承载信息量很大。
“映射关系式隐写模型”的承载信息量一般都很小,在本实验中,重点考察秘密信息“映射关系式隐写模型”的承载信息量,承载信息量用每幅图像所能承载的比特数表示。
目标检测模型 YOLOv5 前向传播的结果是1×25 200×85 的张量,若将其每一个数据映射为一个二进制数,则一幅图像可以无载体隐写的信息量为
通过与现有的无载体隐写方法的承载信息量进行对比,承载信息量比较如表 3 所示。由表 3 可知,本实验采用 YOLOv5 作为载体图像的映射特征,承载的信息量是现有无载体隐写方法的 100 倍左右,即秘密信息也具有巨大的承载信息量。
表 3 承载信息量对比
3.4 抗隐写分析能力评估
在秘密信息的“映射关系式隐写模型”中,由于含密对象和自然不含密载体图像完全相同,Srnet、Xunet、Spam 无法隐写分析出含密对象,秘密信息的抗隐写分析能力很强。而秘密信息的无载体式隐写的映射规则被嵌入载体式隐写到分节码中,一旦分节码被攻击者破获并提取出分节码中秘密信息的无载体式隐写映射规则,那么秘密信息也会轻易且完整地被提取出来,因此分节码“嵌入载体式隐写模型”的抗隐写分析能力十分重要。
在本实验中,分节码的嵌入载体式隐写的图像载体是通过 Srnet、Xunet、Spam 隐写分析模型挑选出来的,需要挑选出不能被这 3 个隐写分析模型都分析出来的含密图像。将其对应的自然图像作为载体,并将分节信息通过 LSB算法隐写入挑选出来的自然图像载体中,与将分节信息通过 LSB 算法隐写入未进行挑选处理的自然图像载体进行抗隐写分析能力的对比,最后,将分节信息隐写入图像载体后没有被隐写分析出的概率表示为抗隐写分析能力。抗隐写分析能力对比如表 4 所示。由表 4 可知,经过挑选和匹配处理后的图像载体,抗 Srnet 隐写分析能力提升为原来的 6.691 倍,抗 Xunet 隐写分析能力提升为原来的 6.585 倍,抗 Spam 隐写分析能力提升为原来的 6.534 倍,平均抗隐写分析能力提升为原来的 6.6 倍。由于 3 个隐写分析模型对 LSB 的隐写分析能力本来就很强,若原本就选择不易被隐写分析出来的隐写方法,则抗隐写分析能力会提升更多,即分节码也具有很好的抗隐写分析能力。
表 4 抗隐写分析能力对比
3.5 隐蔽通信性能评估
本实验以完整的足球比赛视频作为秘密信息隐写的载体,来验证本文提出的隐蔽通信架构在进行秘密信息传输过程中的隐蔽性。足球比赛视频全长 140 分钟,帧数为 30 帧。其中有 637 帧用于映射关系式隐写,3 563 帧用于嵌入载体式隐写,一共可以隐写 931 931 bit 信息,由此可知,该隐蔽通信方法可承载的信息量巨大。通过上述实验得出,秘密信息没有被 Srnet 隐写分析出的概率为 0.482%,没有被 Xunet 隐写分析出的概率为 79.132%,没有被 Spam 隐写分析出的概率为 22.376%,其中未被隐写分析出的概率定义为未被隐写分析出的载体图像数量与参与隐写分析的载体图像的总数量之比。由此可知,该隐蔽通信方法抗隐写分析能力比较强。使用3.2 节 中(1)(2)(3)(4)(5) 类 型 的 噪声对视频进行攻击,并且也使用如式(1)所示的噪声攻击后图像特征平均改变比例来衡量抗干扰能力,隐蔽通信的抗干扰能力如表 5 所示。由表 5 可知,该隐蔽通信方法抗干扰能力很强。
表 5 隐蔽通信的抗干扰能力
3.6 实验结果与分析
在分节码“嵌入载体式隐写模型”中,将分节信息转化为多维码,其所包含的二维码具有极强的抗干扰能力,且固定数据容量大,分节码具有很好的抗干扰能力和承载信息量。通过对分节码的抗隐写分析能力进行实验,得到的分节码也具有很好的抗隐写分析能力。
在秘密信息“映射关系式隐写模型”中,由于含密对象和自然不含密载体图像不可区分,因此秘密信息具有很好的抗隐写分析能力。通过对秘密信息的抗干扰能力和承载信息量进行实验,得到的秘密信息具有很好的抗干扰能力和承载信息量。
4 结 语
本文提出的隐蔽信息传输方法在以视频为载体的隐蔽信息传输中具有很好的实际应用价值。本文仅讨论了 LSB 隐写方法作为嵌入载体式隐写的方法,后续将嵌入载体式隐写的方法推广到更多的隐写方法中去进一步实验是下一步研究的重点。
引用格式:王智瀚 , 严李强 , 姚致远 . 基于多维码技术的隐蔽信息传输方法 [J]. 信息安全与通信保密 ,2023(9):45-55.
作者简介
王智瀚,男,学士,主要研究方向为隐蔽通信、图像隐写、人工智能;
严李强,通讯作者,男,教授,主要研究方向为信号与信息处理;
姚致远,男,学士,主要研究方向为图像处理、信息安全。
选自《信息安全与通信保密》2023年第9期(为便于排版,已省去原文参考文献)
声明:本文来自信息安全与通信保密杂志社,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。