摘要:近几年频发的踩踏事故,使得商业领域、交通管制领域和公共安全领域对人流统计和预测的需求逐渐上升。但是当前的人流统计手段往往采用传统的机械式或人力统计方法,不仅效率低,干扰正常的人员行走以及人流速度,还不能满足实时性统计需求。下文提出的方法采用基于深度学习的目标检测和目标追踪算法,能够对人流量进行实时的统计,并且通过标定和坐标转换能够生成人流热力图方便实时监控。从摄像头数据采集到最终的人流量预测与预警,整个过程形成完整的态势感知系统,功能稳定,满足实时性需求。
一、什么是态势感知
态势感知是指在了解环境中与时间和空间相关的多种因素的基础上,对短时间未来状态进行预测。它包含三个层次:感知层、理解层和预测层[1]。感知层是指从环境中汲取相关感知数据,理解层的作用则是将这些数据整合并处理,预测层则是输出最终的预测结果。这一概念由Endsley[2]于1988年提出,最早用于军事领域如飞行员的训练章程中。后来这一概念被逐渐扩展,应用到信息安全领域以及交通管制领域。
二、人流统计的需求是什么
节假日的景区、类似于春运的大规模人口迁移、世博会和G20等大型会议的召开都会导致人流量在局部地区的突然急增,并造成种种不可预料的结果以及带来人身财产损失。因此在商业领域、交通管制领域和公共安全领域对人流量的统计和预测的需求与日俱增。
三、传统的人流统计方式
传统的人流量统计方法通过使用大型闸机、RFID刷卡器以及红外装置对人数进行计算。缺点包括以下几个方面:首先闸机通道会极大地限制进场速度。再者RFID刷卡器会要求入场人员佩戴射频卡,一旦卡片发生丢失或者损毁便会影响入场人员的进出,并且仅适用于封闭的场景。另外该方法仅适用总人数的统计,没法单独计算某个区域的人口密度。
四、利用视频统计人流的方法
利用视频进行人数统计的方法有很多,早期的方法有:利用传统的HOG+SVM分类器方法对目标进行检测,再利用KCF相关滤波的方法实现多目标跟踪[3],从而统计人流量。这种方法不仅没法实现实时性需求,精度也十分低。
近几年深度学习的发展,使得视频图像处理性能上了一个新的高度。利用神经网络实现目标检测和目标追踪,通过对行人进行检测和追踪便可以统计人数和流速,进一步对数据进行加工处理就可以得到局部区域或者封闭区域的人流量。通过相机标定和坐标转换,就可以实现行人在图像上的坐标,与现实物理世界坐标之间的转换,从而实现在地图上的人流热力图的生成,实现更直观的人流分布展示。
1、目标检测算法
YOLO[4]是基于深度学习的一种端到端的目标检测算法,如图所示是YOLO的整个检测流程。首先将一张图片分成SxS个网格区域,每一个区域称之为一个grid cell,每个grid cell会预测出两个框称之为Bounding BOX(简称BBOX)与置信度,这样一张图片就会预测出SxSx2个BBOX。然后采用NMS非极大值抑制法就可以筛选出目标框。
图1 YOLO算法流程
2、局部区域人数统计
利用YOLO算法实现人形检测,对人形的检测结果如图所示。无论是室内、室外、不同光照和遮挡情况下都能够达到95%以上的检测精度。并且对不同尺寸和场景下的人形都能够被较好的检测结果。对局部人数进行统计只需要统计当前视野范围内的人形检测数目即可获知。
图2 不同场景下人形检测结果
3、通道人员流速
如图所示,对于某区域的进出通道,由于是单行通道,因此人流方向朝着单一方向前进。对每一帧图像进行人形检测后,记录所有人的坐标。然后按照图像上的分隔线,将矩形框视野范围区域一分为二,假设此时视野为入场区域,人流方向从左向右前进。对矩形框内的人员利用Deepsort[5]算法追踪进行位置统计,每个人会被分配一个ID序号,当该人在之前帧出现在左半边矩形内且此时出现在右半边举行内时,人流量加一。由此,便可以统计封闭景区或者场馆的进出口流量,进而计算出总体人员数量。即快速,又不需要人员主动配合。
图3 通道人员目标追踪与流速计算
4、像素坐标与世界坐标转换
摄像机位置与图像之间的映射转换需要知道:摄像机的真实世界地理坐标和方向,以及摄像机本身的内部参数(摄像机成像中心和焦距以及失真系数),最常用的变换方法是Tsai[6]标定法,实现物点到像点之间的关系变换。从世界坐标(Xw,Yw,Zw)到摄像机坐标系坐标(Xc,Yc,Zc)坐标转换公式如下:
5、热力图生成
首先标定摄像机世界地理坐标,高度和方向偏转角。获取行人在图像上的像素坐标后,通过Tsai标定法即可以将行人的世界地理坐标计算出来,然后以热力图的方式在地图上进行显示。如图便是在采集各个路口的人流情况后,计算出的实时人流热力图。
图4 人流密度热力图
6、人流量预测与预警
踩踏事故屡有发生,比如2014年的外滩踩踏事故、麦加朝圣的踩踏事故等等。因为这些区域人数庞大,且处于没有严格进出口的开放区域,因此传统的统计方法难以计数,这就让人群数目在短时间内很可能会上升到一个危险的水平。
因此对于小范围区域如某个观光区域或者室内展览馆某个展区,可以通过监控实时测算当前监控范围内的人数数目,当超过阈值或者可视化热力图超过一定热度级别时,便可以提前预警,并采取相关措施,防止危险事故的发生。
五、结束语
上述方法与流程,从视频流输入,到人形检测与目标追踪,之后利用坐标转换实现可视化人流热力图,最终实现人流的预测和预警。整个过程形成一套完整的人流态势感知体系,具有实用价值与学术研究价值。
参考文献
[1] 王慧强,赖积保,朱亮,梁颖.网络态势感知系统研究综述[J].计算机科学,2006(10):5-10
[2] Endsley M R. Design and evaluation for situation awareness enhancement[C]//Proceedings of the Human Factors Society annual meeting. Sage CA: Los Angeles, CA: SAGE Publications, 1988, 32(2): 97-101
[3] 殷涛,崔佳冬. 视频监控行人流量统计系统的设计[J]. 电子科技,2019,(12):1-6
[4] Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 779-788.
[5] Wojke N, Bewley A, Paulus D. Simple online and realtime tracking with a deep association metric[C]//2017 IEEE International Conference on Image Processing (ICIP). IEEE, 2017: 3645-3649.
[6] 杨景豪, 刘巍, 刘阳, 等. 双目立体视觉测量系统的标定[J]. 光学 精密工程, 2016, 24(2): 300-308.
作者:李敏 杨阳
声明:本文来自中国保密协会科学技术分会,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。