关键词:人群计数;编码-解码结构;多尺度;空洞空间金字塔池化;计数误差;损失函数
DOI:10.7652/xjtubx202005020
2020年5月,国内知名、EI检索学术期刊《西安交通大学学报》发表了一篇我所科研团队题为“编码-解码多尺度卷积神经网络人群计数方法”的研究论文。
随着国民经济迅猛发展及城市化进度不断加快,城市人口数量急剧增加,由此带来的社会问题也不断增加,例如:人员拥挤导致踩踏等不安全事故的发生;候车大厅人员的增加对交通调度带来的压力等。解决上述问题需要准确预测出实际场景下的人群数量,而图像可以清晰直观的反映出实际场景中的人群变化情况,因此基于图像信息的人群密度估计与计数有重要的研究意义。
本研究基于多列卷积神经网络人群密度估计方法,针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码架构的多尺度卷积神经网络人群计数方法。网络编码器采用多列卷积捕获多尺度特征,通过空洞卷积和空间金字塔池化结构扩大感受野并降低参数量,保留尺度特征和图像的上下文信息;解码器对编码器输出进行上采样,实现高层语义信息和编码器前端低层特征信息有效融合,从而提升了密度图的输出质量。为增强网络对计数的敏感性,在以往像素空间损失的基础上考虑了计数误差描述,提出了一种新的损失函数。
本研究提出一种基于编码-解码结构的多尺度人群密度估计网络模型,解决了多列卷积神经网络人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题。