摘要:近年来,随着WiFi技术的不断成熟和无线设备在室内的广泛部署,基于CSI的室内指纹定位技术研究取得了一系列突破性研究成果,使其在信息化服务、目标定位导航以及安全管理等方面体现出了很强的理论研究意义和实用价值。因此,首先介绍CSI的频率特性与获取方法,其次对基于CSI的室内指纹定位中离线阶段的特征提取、在线阶段的定位等相关算法进行归纳和分析,最后指出目前研究的局限性与可能的发展方向。
0 引言
室内定位是指利用无线通信、基站定位、惯性导航定位等多种技术,在某一时刻确定出人员/物体在室内的具体位置,是基于位置服务(LBS)领域的重要研究内容。室内定位因能完成人员/物体等在室内位置的精确感知,从而使其在医疗辅助、井下救援、智能家居和智能教学等众多领域具有巨大的应用前景和经济价值。
目前已被应用到室内定位中的技术和方法有很多,包括红外线定位、RFID射频识别、超声波定位、蓝牙定位技术、超宽带(UWB)技术和传感器定位等。这些传统的室内定位方法普遍存在成本高、需携带专用设备、隐私安全易被入侵等限制性问题。而基于WiFi的室内定位具有无需携带设备、可穿墙扫描、保障个人隐私、成本低等优点,成为当前研究室内定位的重要方向。它通过已知无线接入点(AP)的位置坐标信息,根据理论经验和构建信号传播模型等对已连接的移动设备进行位置定位。
目前,基于WiFi的室内定位获取的数据形式主要有接收信号强度(RSS)和信道状态信息(CSI)两种。RSS表示的只是一个叠加的信号强度值,很多有用信息如相位都被忽略,因此不能很好地反映信号在链路中的传播特性。RSS很容易受环境变动的影响,即便在静态环境中也会出现一定范围的波动。因此,RSS仅在一些简单环境中能达到理想的效果,而在传统的室内环境中,CSI要比RSS更加稳定[1]。另外,CSI同时包含幅度和相位信息,比单值的RSS能提供更丰富的频域信息。综上,CSI相较于RSS具有更好的稳定性和位置敏感性,为实现更鲁棒和灵活多变的环境感知应用提供了新机遇。
1 基于CSI的室内定位基本原理
人员/物体在无线信号范围内活动会对接收到的无线信号产生干扰。发送端发射的无线信号在传输过程中受物理空间环境或人的因素(位置、姿势、动作)影响,形成直射、反射和散射等多条路径传播产生多径效应。接收端接收到的信号反映了环境特征信息的多径叠加特征[2]。当接收端检测到信号发生变化时,可以推断有某些因素导致信号波动。CSI考虑到天线数和子载波数,包括频率域中每个子载波的信道状态信息,一次可以获得多个随时间变化并保持相对稳定的CSI值。信道状态的频域模型[3]被描述为:
Y、X、H、N 分别表示接收信号向量、发射信号向量、信道矩阵和高斯白噪声。其中,信道矩阵代表维度为Nt (接收端的天线数)×Nr (发送端的天线数)×S (OFDM子载波数)的多个子载波信息。信道矩阵被描述为:
信道矩阵描述了信号在每条传输路径上的衰弱因子。信道矩阵[4]中每个元素的值都包含着信号散射、环境衰弱和距离衰减等信息。
由于CSI描述链路层信息,普通的WiFi硬件通常不会输出该信息。为了获得CSI值,一般采用以下几种方式:
第一,构建软件定义无线电硬件平台[5](SDR platform),该方式所需成本较高。
第二,通过安装Intel5300无线网卡并修改驱动固件方式[6],采集CSI数据。
第三:使用Atheros9390 NIC[7]采集CSI原始数据包。
基于CSI的室内指纹定位流程通常分为两个阶段:离线数据库构建和在线定位匹配。在离线阶段,首先使用装有CSI Tool的Linux操作系统接收WiFi信号,获取PHY层的CSI值。其次,对获取的CSI数据进行去噪降维,然后进行幅度和相位处理,并提取可以代表位置的特征值构建指纹数据库。在线定位阶段将测试点的相位振幅信息处理后提取特征值,与指纹库内信息进行比对得出测试点位置。针对以上工作过程,本文将分别从离线阶段特征提取、在线阶段位置定位两方面分析一些算法,并在此基础之上阐述目前该研究方向存在的难点问题和未来可能的发展方向。
2 特征提取
不同位置的特征提取是基于CSI室内指纹定位的关键步骤,直接影响室内定位的鲁棒性和定位精确度。特征提取到的指纹必须满足稳定性和区分性两个要求。稳定性即采集到的指纹不随时间的变化发生明显变化。区分性即在不同的位置指纹应该有较大的区别度。
原始的CSI数据并不能直接用于分类器,想要分辨不同位置,需要先从CSI数据包中提取代表该位置的有效特征。目前,提取特征值的方法主要包括深度学习法、PCA法等。
2.1 深度学习法
2006年以来,深度学习开始在人工智能领域崭露头角,尤其是在室内指纹定位的特征提取上得到了广泛应用。它将特征学习和分类结合实现端到端的输出,模型隐藏层数多、参数大,使其具有表示大规模数据的能力。尤其当数据特征不明显时,深度学习能够学习到更好的特征。在测量到丰富的CSI数据后,通过将数据作为输入,层与层之间的权重系数作为输出,可以将深度学习引入室内指纹定位的研究中,以提高定位精度。
深度学习算法主要通过组建含有很多个隐藏层的机器学习模型和大量的训练数据来学习更有效的特征,不需要人工手动构造特征,解放了人力,节省了物力,提升了室内定位的精确度。通过深度学习法提取特征,更有利于能够挖掘CSI数据丰富而全面的内在信息。但是,目前深度学习在特征提取上也要考虑以下局限性如深度不足、训练完成后无法修正学习结果、除非重新训练等。
2.2 PCA算法
主成分分析法(PCA)是起源于20世纪80年代的一种降维去噪方法,主要是将高维特征空间的数据利用最高方差通过线性变换投影到低维空间上,把多个指标通过少数几个综合指标来表示,达到降维的目的。PCA算法的本质是利用对角化协方差矩阵让各个维度之间的相关性最小,保留下来的维度的能量最大。更具体地说,对高维度的数据集进行降维时,最大限度地保证原始数据不失真,并且尽可能去除冗余数据和干扰噪声[8]。
将采集的CSI信号直接作为指纹特征,其数据的维数较高,参数估计的难度较大,计算量也大。因此,通过PCA算法进行主要特征提取,去除定位特征与分量之间的相关性,不仅可以对数据进行降维,减少数据量,还可以去除CSI信号中的噪声,降低定位误差。
3 在线定位方法
在基于CSI的室内指纹定位研究中,在线定位阶段是指在未知位置测量目标的信号特征,然后对特征进行处理,通过特定的匹配算法比较测量数据与离线训练时建立的数据库中的数据,找出或计算出相似的数据所对应的位置信息,作为位置的估计值。典型的指纹在线匹配算法大致可分为三大类:基于近邻选择的指纹定位算法、基于概率性算法以及基于机器学习算法。
3.1 基于近邻选择的指纹定位
基于近邻选择的指纹定位算法包括最近邻法(NN)、K近邻法(KNN)和K加权近邻(WKNN)算法,基本思想是将与待定位节点特征值最相似的一个或者K 个参考点的坐标进行平均或加权,最后计算出待测点的估计位置。
3.1.1 最近邻法(NN)
NN算法在室内定位过程中,接收端接收到n 个发射端的n 维信号指纹,记为R=(R1,R2,…,Rn) ,然后将此信号指纹R 与所有参考点的指纹数据F=(F1,F2,…,Fn) 进行匹配。NN算法在匹配时需要计算定位目标指纹R 与参考点指纹F 之间的距离,距离计算公式为:
式中,当q=1 时代表曼哈顿距离,当q=2 时代表欧氏距离。NN算法选取与定位目标指纹 距离最小的指纹数据Fi 的位置坐标(Xi,Yi) 作为定位结果。
NN算法计算过程简便,但是计算结果误差较大,因为WiFi信号传播时受环境影响严重,实际上计算的最近邻与真正的最近邻有误差,且NN算法无法应用到连续参考点,只能定位离散的参考点。
3.1.2 K近邻法(KNN)
K近邻算法是NN算法的改进。KNN算法不是选择与定位目标指纹R 距离最近的参考点作为指纹Fi ,而是获取与R 距离最近的前k 个参考点的指纹,计算这k 个参考点的坐标的平均值作为位置估计,定位公式为:
KNN算法通过测量不同特征之间的距离进行定位。该算法在使用时凭借简单的思想、理论日益成熟、训练时无需输入数据假定等优势得到了人们的青睐。缺点是K 值需要人为预先设定,不能自适应找到最优参数,因此在线定位匹配过程中可能会因参数 值设定不准确而降低定位准确度。此外,当样本数据很少时容易产生大误差,而样本数量太大时又容易导致计算复杂度很高。因此,可以通过优化K 值提高定位效果。
3.1.3 加权K近邻法(WKNN)
WKNN算法是在KNN算法上的一种改进算法。WKNN和KNN算法的不同在于确定k 个指纹的参考点后,KNN算法求的是k 个参考点坐标的均值,而WKNN是每个参考点的坐标值乘以一个加权系数,然后把参考点的位置坐标加权平均。对于定位接收端,WKNN定位公式为:
Di 为接收端与第i 个指纹数据之间的欧氏距离。因为除法公式中分母不为0,所以把看做一个很小的正常数,(Xi,Yi) 是第i 个参考点的坐标, 为WKNN算法的定位结果。
WKNN的定位精度比NN、KNN高,但实测中仍然存在定位精度有限的问题。目前的研究主要在于对WKNN提出一种自适应修正方案或者是把WKNN与极大似然法相结合。
3.2 概率性算法
概率性算法需要通过采集大量的样本数据统计每个参考点上指纹特征的概率分布。常用的概率性算法是朴素贝叶斯概率法(Bayes)。
朴素贝叶斯算法属于生成式模型,需要的参数非常少,对缺失数据问题不太敏感。它通过计算后验概率大小进行定位,当样本数据较少时具有较好的定位精度。缺点是该算法必须在假设目标特征之间相互独立的基础上进行分类。实际应用中,特征之间不可能绝对独立,因此影响了实际的定位效果。此外,在室内指纹定位研究中的距离匹配方法中,为提高匹配效果,通常建立稳定的大容量位置数据库,将导致其系统计算效率较低,且时间跨度的变化对其影响也较大。
总体来说,基于概率统计模型的方法具有更好的适用性,但是训练样本的容量带来的复杂度问题也是未来研究中的难点。
3.3 基于机器学习算法
基于机器学习的算法主要通过对采集的样本数据和位置坐标进行离线训练,找到特征值与坐标之间的函数关系,然后将采集的需要定位的信标节点的指纹特征输入函数关系,进而计算最后的估计坐标。常用的方法支持向量机(SVM)。
SVM在1995年由Cortes和Vapnik首次提出,是一种基于统计学理论的VC维理论,目标是最小化结构风险[9]。SVM是一种判别式模型,在机器学习算法范畴内,是一个有监督的学习模型,可以根据有限的样本信息,在模型复杂度和学习能力之间求得最佳折衷效果,是一种通过搜寻最大边缘超平面来确定最优决策边界的分类回归算法。
SVM通过利用核函数将非线性问题映射到高维特征空间中进行线性分类,并用松弛系数或惩罚系数调整分类结果,因此在解决高维、非线性分类问题方面优势明显。可以将SVM良好的分类、回归能力应用到室内定位,训练速度快,并不要求大量的训练数据集,但也带来较大的分类计算成本,且训练过程时间较长。
基于机器学习的定位算法除了支持向量回归法,还有决策树。决策树(Decision Tree)是一个模拟树结构形式构建的分类模型。用决策树算法进行室内定位,先利用训练数据构造一颗决策树模型,再通过该模型对输入的数据特征判别进行分类,依据分类结果确定目标的位置。通过决策树算法进行定位,分类准确率较高,自上而下的建树分类过程具有较好的可视化效果,易于理解。利用决策树分类模型不需要太多训练数据,算法计算成本较低,能耗较少,但建树过深、分支过多时易发生过拟合问题和最优化问题。
4 目前研究存在的局限性与未来可能的研究方向
目前,存在各种利用CSI进行室内指纹定位的文献,运用各种方法能准确进行数据库的构建和在线定位。但是,实际定位中仍然存在很多局限,也有很多急需发展的研究方向。
4.1 局限性
基于CSI的室内指纹定位的研究主要涉及CSI数据获取、特征提取和表示以及在线匹配等阶段。通过对文献的详细分析发现,基于CSI的室内定位存在的主要局限如下。
(1)未知环境的定位问题。目前,大多数指纹定位技术都基于受控的实验环境,但实际应用场景并不都是熟悉环境,指纹受环境变化的影响很大。当环境改变时需要更新指纹数据库,在一个未采集的区域将无法提供定位服务,因此指纹定位方法并不适合大范围推广。
(2)定位实时性限制。为了达到对室内环境的全覆盖,需要多个AP作为信标。在定位中如果需要获取多个AP的CSI,需要终端连接到每个AP后才能获取CSI值,影响定位的实时性,降低了系统的鲁棒性。
4.2 发展方向
目前研究分析知,仍有以下问题需要解决。
(1)实现三维的空间定位。目前,WiFi室内定位还局限在平面内的位置估计,大多数实验都是将AP和接收天线人为地尽量调整到同一高度。这与实际应用场景有一定出入,如在大型商场中,AP与接收天线往往不在同一水平面。如何实现该场景的WiFi室内定位值得未来进一步研究。
(2)实现算法在智能设备上的可视化应用。目前,只有部分无线网卡和智能手机能够采集CSI信息,使得定位系统不具有商业普适性。因此,未来的工作可以考虑如何在移动设备上采集CSI信息,将室内定位算法实现实时可视化,从而推动基于CSI的室内定位技术的实际运用。
5 结 语
基于CSI的室内指纹定位一直是多年来的研究重点,是把WiFi信号运用于环境感知的重要应用。鉴于WiFi设备的大量普及,该领域研究将具有非常广阔的应用前景。本文根据基于CSI的室内指纹定位的一般步骤,分析近几年相关基于CSI的室内指纹定位研究中的离线阶段特征提取和在线阶段定位阶段两方面内容,并对目前研究的一些限制及未来发展方向进行讨论。尽管在过去的几年,利用CSI进行环境感知已取得较大进步,但基于CSI的环境感知技术仍处于萌芽阶段,具有广阔的应用前景,期待在不久的将来能涌现出更多的创新型研究及其应用。
参考文献:
[1] Wu K,Xiao J,Yi Y,et al.CSI-Based Indoor Localization[J].IEEE Transactions on Parallel & Distributed Systems,2013,24(07):1300-1309.
[2] Yang Z,Zhou Z,Liu Y.From RSSI to CSI:Indoor Localization via Channel Response[J].ACM Computing Surveys,2013,46(02):1-32.
[3] LIU Yi-bo,XIU Chun-di,ZHU Yun-long.Indoor Positioning Method Using Channel State Information[J].Computer Engineering and Applications,2016,52(22):238-241.
[4] Mohammed,Abdulaziz,Al-qaness,et al.Human Behavior Recognition System Based on Channel State Information[J].Journal of Wuhan University of Technology,2016,38(04):76-80.
[5] Chen B,Yenamandra V,Srinivasan K.Tracking Keystrokes Using Wireless Signals[C].International Conference on Mobile Systems,Applications,and Services ACM,2015:31-44.
[6] Halperin D,Hu W,Sheth A,et al.Tool Release:Gathering 802.11n Traces with Channel State Information[J].ACM Sigcomm Computer Communication Review,2011,41(01):53.
[7] Sen S,Lee J,Kim K H,et al.Avoiding Multipath to Revive Inbuilding WiFi Localization[C].Proceeding of the International Conference on Mobile Systems,Applications,and Services ACM,2013:249-262.
[8] Fang S H,Lin T.Principal Component Localization in Indoor WLAN Environments[J].IEEE Transactions on Mobile Computing,2012,11(01):100-110.
[9] Sain S R.The Nature of Statistical Learning Theory[M].Springer,1995.
作者简介:
孙沙沙,山东科技大学 电子通信与物理学院,硕士在读,主要研究方向为无线通信、机器学习;
梁泉泉,山东科技大学 电子通信与物理学院,博士,讲师,主要研究方向为无线通信、机器学习。
(本文选自《通信技术》2019年第二期)
声明:本文来自信息安全与通信保密杂志社,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。