当前位置: > 硕士毕业论文 > 36490字硕士毕业论文视频监控计数方法综述及实现

36490字硕士毕业论文视频监控计数方法综述及实现

论文类型:硕士毕业论文
论文字数:36490字
论点:图像,的人,检测
论文概述:

本文是统计专业论文,本文主要研究近距离场景下视频人数的统计,如走廊或者出入口。同时采用了单摄像机进行视频图像的采集,为了对现有的人数统计方法进行改进。

论文正文:

单线理论

1.1主题的背景和意义
随着国内社会经济的持续快速发展,大型体育场、中央广场、公共娱乐场所、大型会议中心、购物中心等设施越来越多。关于人数的统计可以在上述不同的情况下发挥不同的作用。对于商场来说,不同时间段、不同地点的人群分布和移动方向等信息可以为管理者提供商业选择,从而增加对用户的吸引力,增加销售额。对于公共服务场所,数字统计系统用于了解和分析人们的行为和习惯,评估座位、电话亭、卫生设施等服务设施的便利性和利用率,从而提高建筑物的设计质量,提高人员的工作效率,监控人员流动。同样,对于公共交通,交通统计可以实时获取乘客数量和分布数据,合理分配和管理资源,提供可靠的安全性。特别是对于大型公共聚集场所,安全问题更加突出。在我国,已经发生了许多拥挤的踩踏事件,主要发生在学校、体育场馆、音乐会等人群聚集的地方[1]。据相关统计,当人口密度高达0.15 m2/人时,人口很容易失控。这给出了人口密度与人口中灾害数量之间的关系,为利用数字图像处理方法对人口进行自动实时监测提供了依据。通过对人群流动的实时统计,可以减少和避免上述事故。在此基础上,通过对人群流动的统计,可以为社会提供巨大的商业利润,为人们的生活提供更安全、更好的服务环境。
………

1.2国内外研究综述

1.2.1计算机视觉和视频监控
随着信息时代的到来,计算机视觉技术也在不断进步。计算机视觉技术是一门新兴学科,是一种基于数字图形的图像处理技术。这项技术通过计算机模拟和取代人类的视觉功能。主要研究目的是使计算机能够通过二维图像智能地识别三维信息,也就是说,使计算机能够感知诸如真实物体的形状、位置、运动、纹理等视觉信息,并通过这些信息模拟人类的思维来理解和处理实际情况中的问题[3]。计算机视觉处理技术是一门综合性的交叉学科,涉及数学、信号处理、物理等许多领域。其中,智能视频监控的应用越来越受到重视,计算机视觉在这一领域的研究也越来越广泛。在当今社会,视频监控主要是手动进行,以监控安全隐患或异常状态并对其进行分析。其缺点是难以进行实时、有效的安全监控和检测,远远达不到安全监控要求的标准。然而,智能视频监控技术可以利用计算机视觉计数对捕获的图像序列进行动态智能分析和处理,并通过计算机的数据处理功能动态理解和分析视频中的大量信息,从而帮助用户去除干扰信息,提供用户[4]所要求的准确结果。智能视频监控技术可以充分利用计算机视觉技术和图像处理方法建立智能管理系统。无需人工干预,通过对视频中图像序列的智能分析,可以实现对行人的精确检测和实时跟踪,从而进一步精确计算人口
2人员统计相关技术概述。通过视频监控平台,与传统计数方法相比,基于视频图像处理的计数系统适用性强、开发成本低、使用周期长、实时性和准确性高,国内外已经进行了大量的研究。
………

[5]

2.1图像预处理
在获取视频图像的过程中,由于光线、背景和硬件条件等诸多不可避免的外部因素的影响,后续的图像数据分析将受到严重影响。因此,在获取图像后,对图像进行预处理是非常必要的。图像预处理也可以理解为增强图像的有用信息和改善图像的视觉效果。预处理过程主要包括形态学变换、图像平滑、图像增强、图像分割等步骤[20]。其中,频域法和空域法是增强图像的两种主要方法。根据本文的实际需要,下面详细描述了图像平滑、对比度增强和边缘检测的几种方法。图像平滑的主要目的是消除噪声,减少对图像处理的影响。图像中存在多种噪声,如椒盐噪声和高斯噪声。椒盐噪声是一种黑白亮暗点噪声,主要由图像传感器、传输通道和解码处理产生。所谓高斯噪声是指其概率密度函数服从高斯分布。噪声对图像信号幅度和相位的影响相对复杂。不同噪声和图像信号之间的关系是不同的,其中一些是相互独立的。因此,对于图像中的不同类型的噪声,应该采用不同的方法来获得满意的结果。
………

2.2人脸检测方法
人脸包含大量信息,是一种复杂的多维非刚性模式。人脸具有结构恒定性,可变性强,图案变化丰富细致,包括丰富的图案特征,如图2.11所示。20世纪90年代以来,国内外人脸检测的研究取得了巨大的成就。目前的人脸检测方法主要是为了提高检测精度和实时性,主要分为以下四类。基于先验知识的方法是对各种面部器官之间的关系进行编码的面部检测方法。这些规则可以有效地捕捉面部特征之间的关系[28]。例如,在图像中检测到的脸部的眼睛是对称的,并且有鼻子、嘴巴等。眼睛正下方。这些关系主要体现在位置和距离上,因此,该方法适用于人脸定位。对于输入图像的某一部分,局部面部特征或各种器官(如眼睛、鼻子、嘴巴等)的特征。)首先搜索人脸,然后计算这些特征之间的相对位置和距离关系,最后根据人脸器官的对称性和灰度差的先验知识判断该区域是否满足标准。杨和黄等人用镶嵌法实现了复杂背景下的人脸检测。该方法主要基于人脸灰度分布的规则,并以低分辨率到高分辨率样本是否满足规则作为判断依据[30】。Chetverikov等人利用人脸亮度分布形成的散斑和条带信息实现了人脸检测。一个人的脸包含两个黑点和三个亮点,而条纹是脸、嘴唇、鼻梁等的轮廓。这些斑点之间的位置关系和条纹的分布用于判断候选区域是否是人脸[31]。基于知识的方法的缺点是很难将人脸的所有知识转换成准确的规则,而且这些规则不具有普遍性,这将导致人脸在特殊情况下无法被检测到。此外,使用几何知识很难检测具有不同姿势的面部。
………

基于肤色信息和矩形特征的
3人脸检测基于AdaBoost算法的
3.1人脸检测...(17)
3.2 YQ人脸区域颜色模型分割...(21)基于肤色特征和改进AdaBoost算法的
3.3人脸检测...(25)[/br/ ]3.4实验结果和分析.......(27)
3.5本章摘要...(28)
4多目标跟踪计数方法
4.1卡姆移位算法原理.........(29)
4.2多级特征融合凸轮位移目标跟踪算法...(33)
4.3多目标跟踪和计数.........(35)
4.4实验结果和分析.......(37)
4.5本章摘要...(39)
5系统设计和测试分析
5.1总体系统设计...(40)
5.2详细系统设计...(41)
5.3实验测试和分析...(44)
5.4本章摘要...(46)

5系统设计和测试分析

5.1整体系统设计
系统的硬件环境是:一台普通电脑(中央处理器:英特尔i5 2.40GHz千兆赫,2GB内存)和一台高清摄像头(用于采集原始视频数据)。软件环境如下:系统运行在视窗7操作系统上,操作环境由VS2005构建,OpenCV库用于视频编解码和常用图像处理。OpenCV是一个开源的计算机视觉库,它实现了图像处理和计算机视觉中的许多基本算法。OpenCV中的功能主要分为3类,如图5.1所示。人数统计系统主要分为三个部分:视频素材采集、图像处理和数据分析。架构如图5.2所示。视频素材采集系统:视频素材主要来自公共场所的摄像机,采集的视频数据由系统发送到图像处理子系统进行处理。图像处理系统:对采集的每一帧图像进行相应的处理,处理后的信息用于人脸检测和多目标跟踪,为人口统计系统提供良好的交互界面。数据分析系统:图像处理系统可以根据需要对本地存储的数据进行进一步的分析和处理。
………

结论

通道出入口等封闭环境中的人数自动计数技术是当今世界计算机视觉研究的热点领域之一。然而,由于实际应用中各种内部因素和外部因素的影响,准确、实时的人口统计变得更加困难。本文在了解国内外研究的基础上,对人脸检测和目标跟踪计数等人口统计关键技术进行了深入研究。本文的研究内容主要分为以下三个方面:
(1)人脸检测:改进了AdaBoost分类器的训练过程。基于人脸样本的重要性高于非人脸样本的思想,在迭代过程中给不同的样本赋予不同的权重来更新不同样本的权重,从而提高分类器在人脸检测中的准确性。同时,为了减少分类器对图像的扫描时间,在使用AdaBoost算法进行人脸检测之前,首先建立基于YQ color空的肤色模型,分割图像中的类皮肤区域,并通过面积法去除非人脸区域。最后,AdaBoost不需要扫描整个图像,只扫描分割区域,从而大大减少了检测时间。
(2)目标跟踪计数:检测到人脸区域后,选择这些人脸作为跟踪目标。为了精确地跟踪目标,提出了一种概率反投影图,它结合了色度特征空和纹理特征空。然后采用Camshift算法对目标进行跟踪,增强了跟踪的鲁棒性。为了跟踪和计数多个目标,使用多个Camshift跟踪器对跟踪多个目标过程中的遮挡等问题进行跟踪并给出有效的解决方案,从而实现对监控区域内多个人脸的跟踪和计数。
(3)设计并实现了视频监控中的计数系统,并对实验结果进行了分析,验证了该方法的可行性。
……
参考资料(略)