> 检测 > 目标检测与搜索算法的结论与参考文献,目标检测算法ssd是否提供cpu版本操作

目标检测与搜索算法的结论与参考文献,目标检测算法ssd是否提供cpu版本操作

目标检测与搜索算法的结论与参考文献

固态硬盘是否提供运行快速RCNN的cpu版本?区域神经网络是根据图像本身的颜色和边缘信息生成区域建议的网络。因此,实现了端到端,但是慢速YOLO将原始图像分成7

目标检测与搜索算法的结论与参考文献

运动目标检测与跟踪技术有哪些算法

第一章介绍了运动的分类、计算机视觉领域的运动分析模型、计算机视觉领域运动检测和目标跟踪技术的研究现状以及运动分析技术在计算机视觉领域的难点。第二章介绍了传统的运动检测和目标跟踪算法,包括背景差分法、帧间差分法、光流场评估算法等。黄鹤从未重游地球,白云永远没有他 属于方法专利,属于软件技术领域。我希望我能帮你——邢凯达知识产权搜索答案。我想问一个运动物体检测的问题。除了深入学习,还有什么其他算法值得研究。所有问题都是经济、金融、企业管理、法律法规、社会和民生、科学、教育和健康生活。我还想知道如何得到颜色概率分布图,即颜色投影图。你知道什么是颜色概率分布图吗?你能告诉我吗?谢谢你

目标检测算法ssd是否提供cpu版本操作

固态硬盘是否提供运行快速RCNN的cpu版本?区域神经网络是根据图像本身的颜色和边缘信息生成区域建议的网络。因此,实现了端到端,但是慢速YOLO将原始图像分成7

目标检测与搜索算法的结论与参考文献

运动目标检测与跟踪技术有哪些算法

目标检测与搜索算法的结论与参考文献范文

本文的目录导航:

面向深度学习的目标检测和搜索算法研究??

[第一章]基于深度学习的视频运动目标介绍

[第二章]学习视频运动目标的相关工作

[第三章]基于卷积神经网络的视频目标定位与检测

[第四章]基于时间空双流的视频角色运动检测

[第五章]基于循环神经网络的视频目标自然语言搜索

[第6章]目标检测和搜索算法的结论和参考文献

第6章总结和展望

6.1工作总结

检测和搜索视频运动目标是计算机视觉领域的一项重要任务。主要难点在于如何利用深度学习算法分析目标的类别和位置。近年来,传统的深度学习算法在简单静态图像识别方面取得了突出的成绩,但仍然不能检测视频对象,满足自然语言搜索视频对象的要求。

本文主要研究视频图像中目标的检测和搜索。首先,提出一种基于目标候选帧边界概率卷积神经网络模型的目标检测算法,完成视频中目标的定位和识别。其次,利用基于时间空双流模型的字符运动检测算法完成视频中动作的识别。最后,利用基于循环网络的视频目标自然语言搜索模型,搜索出与自然语言查询语句相对应的目标。具体研究内容如下:

(1)提出了一种基于目标候选帧边界概率的卷积神经网络模型来完成视频图像的目标定位和识别。该模型首先计算目标候选边界帧在某一搜索区域的四条边缘概率,以获得更接近人工标注边界的候选,然后通过迭代与目标识别模型合并。实验结果表明,该模型能够提高视频中目标区域定位和目标类别识别的准确性,模型实验中目标区域的召回率和目标识别的准确性都有一定程度的提高,表明该模型能够更准确地检测视频中的目标。

(2)提出了一种基于时间空双流特征的卷积神经网络模型来完成视频中人体运动的检测。首先在深度卷积层融合预训练的空内流和时间流,然后在中间层利用融合的时间空双流运动检测模型提取时间空特征,最后利用三维卷积神经网络模型完成视频中人体运动的检测。此外,在实验过程中将该模型与现有模型进行了比较和验证。通过观察实验数据,可以发现本文提出的视频字符动作识别模型在数据集UCF101和HMDB51上的识别准确率较高,表明基于时间空双流特征的卷积神经网络模型能够更准确地识别视频中的字符动作。

(3)提出了一种基于自然搜索语言的循环神经网络模型来完成视频目标的自然语言查询。首先利用卷积神经网络并行提取局部目标区域和全局特征,然后利用两层GRU循环神经网络融合这两个特征和自然语言搜索语句的特征,完成自然语言目标搜索。模型实验的搜索精度高于现有的文本搜索模型LRCN和CAFFE-7K,表明该模型能够使用自然语言更准确地搜索视频中相应的目标。

软件工程

6.2[工作展望/S2/]

视频中的目标检测和搜索是计算机视觉领域的重要课题之一。本文通过构建视频目标定位检测模型、视频人物运动检测模型和视频目标自然语言搜索模型,完成了简单的视频运动目标搜索。但是,对于视频中的目标检测和识别任务,需要在以下几个方面进行进一步的深入研究:

(1)提高视频目标检测的鲁棒性。在本文的目标检测过程中,没有考虑一些外部环境因素对目标的影响、视频目标的相互遮挡以及没有固定形状的目标检测。天气因素包括大雨、雪等。没有固定形状的目标包括天数空、道路等。如果将上述因素考虑在内,视频目标的检测能力将大大提高。在这种情况下,我接下来的工作将集中在目标位置和识别上。

(2)扩展视频角色运动检测模型的线索。本文没有充分利用视频中的音频和文本等固有信息。这些是视频角色运动检测的重要线索。如果这些重要线索能够被有效地提取和融合,视频角色运动检测的能力将得到显著提高。本文将在后续工作中重点研究基于音频和文本信息融合的视频字符运动检测。

(3)扩展视频目标的自然语言搜索能力。本文的视频自然语言目标搜索包含了视频图像中全局信息目标的位置信息,但目标搜索仍然不能实现视频中多个目标的同时搜索,因为多个目标的自然搜索语句可能包含多个目标之间的关系,本文没有进行目标之间关系信息的提取。如果能够完成多目标自然语言搜索,将使目标自然语言搜索更加贴近生活的实际使用。本文将在接下来的工作中重点研究多目标自然语言搜索。

参考[/s2/]

[1]米什拉·平,萨罗哈·高·平.用于物体检测和跟踪的视频监控系统的研究[·中]//2016年IEEE计算促进可持续全球发展会议记录,2016: 221-226。

[2][2]李红,黄英,张z .一种改进的快速检索同一对象的无线网络[.IEEE接入,2017,5:13665-13676。

[3]范斌,史密斯。数字文化对象基于语义和上下文检索的元数据扩充[3]//2007 IEEE数字图像计算技术和应用会议录,2007: 515-522。

[4][4]杨毅,杨磊,吴庚,等.使用查询上下文对象包检索模型的图像相关性预测[.IEEE多媒体交易,2014,16(6): 1700-1712。

[5]俞C,薛兵,王勇,等.高光谱图像分类的多类约束背景抑制方法[C]//2017年IEEE/ GRSS国际地球科学与遥感会议论文集(IGARSS),2017: 23-28。

[6]周志华。机器学习[。北京:清华大学出版社,2016:97-120。

[7]关勇,姜斌,肖勇,等.一种新的图像显著性检测图排序模型问题[C]//2017年IEEE软件工程研究、管理与应用会议录(SERA),2017: 151-156。

[8]博纳迪F,艾努兹S,布特托R,等.一种新的用于长期车辆定位的全球图像描述方法[C]//2017年信号处理会议录(EUSIPCO),2017: 808-812 .

[9]巴蒂亚·S,哈亚特·M,布雷克斯皮尔·M,等.兰开夏·[的基于视频的面部行为分析方法2017 IEEE自动面部和手势识别会议记录,2017:754-761 .

[10]维克拉马拉奇·吴,卡里阿佩尔.一种利用潜在语义分析将评论文本中的整体情感上传到社交网络的方法[[C]//2017年国际电子商务会议图像、视觉和计算会议录,2017: 788-792 .

[11]张宏,陈毅,李德,等.利用视频数据挖掘系统的比特翻转进行低复杂度滑动窗口块解码[.IEEE接入,2017,5: 25171-25180。

[12]菲尔岑斯沃尔布,吉尔希克,麦克艾伦斯特,等.IEEE模式分析和机器智能交易,2010,32(9)1627-1645。

[13]吉尔希克,多纳休,达雷尔,等.基于区域的卷积网络用于精确的目标检测和分割[.《模式分析和机器智能的IEEE交易》,2016,38(1): 142-158。

[13][14]何凯,张霞,任新生,等.用于视觉识别的深层卷积网络中的空间金字塔池[.《模式分析和机器智能的IEEE交易》,2015,37(9): 1904-1916。

[15]吉尔希克快速阅读-美国有线电视新闻网[中心]//2015年IEEE国际计算机视觉会议记录,2015:1440-1448。

[16]任世安,何凯,吉士克,等.更快的r-cnn:用区域提议网络实现实时目标检测[C]//神经信息处理系统进展会议录,2015: 91-99 .

[17]雷德蒙,迪维瓦拉,吉尔希克,等.你只看一次:统一的,实时的物体检测[]//2016年IEEE计算机视觉和模式识别会议记录,2016:779-788 .

[18][18]俞军,杨霞,高福,等.IEEE控制论交易,2017,47(12): 4014-4024。

[19][19]郑勇,姜泽,张宏,等.基于上下文的组织病理学全载玻片图像分析[CBIR·[]。IEEE医学影像交易,2018。

[20]胡若尔,徐海,罗尔巴赫M,等.自然语言对象检索[C]//2016年国际电子工程师会议计算机视觉与模式识别会议录(CVPR),2016: 4555-4564。

[21]加藤,毕林赫斯特.基于视频的增强现实实现系统的标记跟踪和hmd校准[C]//1999年IEEE和ACM增强现实国际研讨会论文集,1999: 85-94。

[22]丁庚,戴青,徐伟,等.基于小波兴趣点的仿射不变图像检索[C]//2005 IEEE多媒体信号处理会议录,2005: 1-4 .

[23]林春海,陈若婷,陈永基.基于颜色和纹理特征的智能图像检索系统[.图像和视觉计算,2009,27(6): 658-665。

[24]黄炳文,戴世凯.基于纹理相似性的图像检索[.模式识别,2003,36(3): 665-679。

[1][25]蔡世凯,童春生.基于广义伽马密度的统计小波子带表征及其在纹理检索中的应用[.IEEE图像处理交易,2010,19(2): 281-289。

[26]尚穆加瓦迪沃,苏玛蒂,瓦迪沃。福希尔:图像检索应用中的模糊物体形状[。神经计算,2016,171: 719-735。

[27]唐纳休,安妮亨德里克斯,瓜达拉马,等.视觉识别和描述的长期递归卷积网络[3]//2015年IEEE计算机视觉和模式识别会议录,2015: 2625-2634。

[28] Pal G,Rudrapaul D,Acharjee S,et al . Video shot border detection:a review[C]//Proceedings of the 2015 emerging ICT for bridge Future-Proceedings of the 49 Annual conventi on of the Computer society of India CSI Volume 2,2015: 119-127 .

[29]勒弗·辛格诉高效稳健的镜头变化检测[.斯普林格,2007,2(1): 23-34。

[30]杨明敏,刘斌.视频镜头的有效匹配和聚类[3]//1995国际图像处理会议录,1995: 338-341。

[31]毛星云,冷薛飞,等。开放式CV3编程导论[。电子工业出版社,2015:352-355。

基于图像序列识别的端到端可训练神经网络及其在场景文本识别中的应用[。模式分析和机器智能的IEEE事务,2017,39(11): 2298-2304。

[3][33]曾永荣,曾永荣,崔斌,等.利用增强反向传播神经网络进行多因素影响的能源消费预测[[]。能源,2017,127: 381-396。

[34]马勇,姜志忠,张宏,等.利用选择性搜索提出组织病理学全载玻片图像的区域进行检索[[中心]//2017年IEEE生物医学成像会议录(ISBI,2017年),2017:156-159 .

[35]阮德德,石坚·L,乌阿尔蒂·N,等.文本边缘盒:场景文本校准的对象提议方法[·C]//2017年IEEE计算机视觉应用会议录,2017: 1296-1305 .

[36]李伟,温升,张美成,等.大规模人体动作识别的自适应神经网络树[·C]//2017 IEEE计算机视觉与模式识别会议进程,2017: 1444-1452 .

[37]卡西亚内利,克斯坦特,恰尔弗利亚,等.服务机器人应用的全GRU自然语言视频描述[]。IEEE机器人和自动化通讯,2018。

[38]波塔兹·梅,科尔·梅,奎诺特·格,等.完全卷积网络和区域实例建议用自我中心视觉识别[·C]//IEEE计算机视觉和模式识别会议记录,2017: 2383-2391。

[39]王伟,施敏,李伟.具有浅卷积特征的目标跟踪[C]//2017智能人机系统与控制论国际电子工程师会议论文集,2017: 97-100。

[40]何凯,张霞,任新生,等.用于视觉识别的深层卷积网络中的空间金字塔池[.《模式分析和机器智能的IEEE交易》,2015,37(9): 1904-1916。

[41]马格努松·L·V,奥尔森·R .利用自动编程改进Canny边缘检测器:改进非最大抑制[·C]//2016遗传与进化计算会议录。,2016年:461-468。

[42]李德尔,沃德,斯雷布罗n .随机梯度下降,加权抽样,和随机卡兹马尔兹算法[C]//神经信息处理系统进展论文集。2014年:1017-1025。

[43]弗鲁哈特米,延奇奇,斯皮查恩米,等。勘误表:在多物体注意过程中的眼睛注视是基于离散空间焦点的表示[。科学报告,2017,7: 46777。

[44]孔泰,姚亚,陈毅,等. Hypernet:走向准确的区域建议生成和联合目标检测[C]//2016年IEEE计算机视觉与模式识别会议录,2016:845-853。

[45]曹旭,杨磊,郭旭。全变分正则化RPCA,用于动态背景下不规则运动目标检测[。IEEE控制论学报,2016,46(4): 1014-1027。

[46]西蒙·金,塞斯曼.[行动识别的双流卷积网络//2014神经信息处理系统会议论文集,2014:568-576。

[47]卡尔帕蒂·阿,托德里奇·格,谢蒂·斯,等.用卷积神经网络进行大规模视频分类[·C]//2014年IEEE计算机视觉与模式识别会议录,2014:1725-1732。

[48]克里热夫斯基,苏士基弗一,辛顿,G . e .具有深度卷积神经网络的图像网分类[C]//2012神经信息处理系统会议论文集,2012: 1097-1105。

[49]瓦尔夫德,卡贝萨斯,鲁拉,等。改进自动化多发性硬化病变分割的三维卷积神经网络方法[。神经影像,2017,155: 159-168。

[50] Tran D,Bourdev L,Fergus R,等.用三维卷积网络学习时空特征[C]//2015年IEEE计算机视觉国际会议录.圣地亚哥,2015:4489-4497。

[51]孙磊,贾凯,杨德镛,等.利用因子化时空卷积网络的人类动作识别[[]//2015年IEEE计算机视觉国际会议录,2015:

4597-4605。[52]克里热夫斯基,苏士基弗一,辛顿,G . e .具有深度卷积神经网络的图像网分类[C]//2012神经信息处理系统会议论文集,2012: 1097-1105。

[53]拉赫马尼·赫,米安·阿,沙阿·米。从新奇的观点学习人类行为识别的深层模型[·杰]。IEEE模式分析和机器智能交易,2017。

[54]吴淇,特尼·丁,王普,等.视觉问答:方法和数据集调查[.《计算机视觉与图像理解》,2017,163: 21-40。

[55]赵海,石杰,齐鑫,等.金字塔场景解析网络[C]//2017 IEEE计算机视觉与模式识别会议论文集(CVPR),2017: 2881-2890。

[56]布拉姆巴特,克里斯腾森海,海斯j .材料网:使用‘材料’改善物体检测[C]//2017年IEEE计算机视觉应用会议进程,2017: 934-943。