当前位置: > 硕士毕业论文 > 59200字硕士毕业论文基于热点标记的视觉时尚商品搜索引擎的设计与实现

59200字硕士毕业论文基于热点标记的视觉时尚商品搜索引擎的设计与实现

论文类型:硕士毕业论文
论文字数:59200字
论点:图像,商品,检索
论文概述:

随着互联网的不断普及,以及第三次互联网产业革命“云计算”的蓬勃进展,大规模数据处理成为研究者们趋之若鹜的方向之一。作为数据的重要代表一“图像”不仅能绘声绘色的描述人们生活

论文正文:

前言

本章介绍了本文的研究环境和影响,国内外的研究现状,以及本文的主要工作和贡献。最后,阐述了本文的基本组织结构。

论文的背景和意义

随着互联网的快速发展,互联网逐渐成为一种类似水、电、气的公共基础设施。根据中国互联网络信息中心(CNNIC)发布的最新数据,“中国将在2012年进入“5亿网民的时代。不仅在中国,而且在世界上,互联网用户的数量也呈指数增长趋势。这种发展趋势为电子商务提供了应用条件,即利用计算机技术、网络技术和远程通信技术实现整个业务(交易)过程的电子化、数字化和网络化。电子商务以其快速、安全、低成本的特点吸引了广大网民的关注。它为消费者提供了一个新的购物环境——网上商店。消费者通过网络进行网上购物和网上支付,避免了交通、餐饮等传统购物环境带来的不便。自1997年底中国第一个专业电子商务网站诞生以来,已经出现了包括淘宝、分众科技(Focus Technology)和HC360在内的多家电子商务上市公司。
今天,网上购物市场无疑已经成为互联网新经济形式中最强大的增长引擎。在传统的购物环境中,人们需要依赖购买和销售商品的实体进行订购,包括区分颜色、风格和纹理。在新的购物环境中,在不能依赖实体的情况下,只有图像和文本可以用来描述商品以吸引购买者的注意力。然而,由于文化、教育和其他环境的影响以及收集图像信息的设备的差异,商品的文本描述和商品图像的多样性都是造成的。因此,如何准确快速地在互联网上检索到与网民提供的商品图像相同或相似的商品,并为网民提供有效的购物指南,成为当今各大电子商务公司的研究热点。
目前,主流电子商务平台主要通过两种方式为用户检索商品提供服务。一种是依靠纯文本检索商品。然而,由于商家之间的文化差异等因素,同一商品不能保证相同或相似的文本描述信息,导致文本检索商品的准确性较低。第二是用图像检索商品。随着移动互联网的快速发展,手机日益成为人们生活中不可缺少的工具之一。它们的功能也从通话和短信阶段发展到拍照和上网相结合的智能阶段。也就是说,拍照和搜索也成为了广大手机用户的共同需求。与依靠文本检索商品相比,商品文本描述的不准确性在一定程度上得到消除,但仅仅依靠商品的纯图像特征进行检索,会在一定程度上失去用户对商品图像特征的语义理解。
本文的重点是提出一种基于时尚元素标签自动学习的检索模型,并验证该模型在服装渠道中的可行性,设计并实现一个服装渠道的时尚检索系统。本文构建的系统主要是在现有ISimila:架构的基础上开发的。ISimila:是广州电信研究所的一个项目。这就是所谓的云计算领域测试视觉搜索能力的研究。它基于云计算,结合了Map Reduce2分布式计算的特点,解决了大规模的可扩展性问题。
本文的主要贡献如下:首先,利用互联网半标签图片库,提出了一种基于时尚标签自动学习的检索模型;二是为深入研究图片的简单视觉特征与用户检索的丰富语义之间的对应关系提供丰富的样本集。三是为相关服装渠道检索系统提供海量数据集。第四,结合Nutch和Hadoop开源项目,我们完成了一个通用的网络数据捕获模块,并提供了单机条件下无法支持的大规模数据处理问题。

1.2首先简要描述了研究内容

主要研究了当前用户的查询意图与系统检索结果之间存在的问题,提出了一种基于时尚标签自动学习的检索模型,主要指利用HOG(方向梯度直方图)特征提取图像的低级特征。基于机器学习中的SVM(支持向量机),建立了服装通道中“静止标签”与图像低层特征之间的对应关系,并通过实验验证了该方法的可行性。其次,根据实验结果,将该模型应用于现实生活场景,完成了基于服装频道的服装检索系统。

第三章是基于时尚标签的自动化……27-34
3.1导言……27-28
3.2数据准备……28
3.3对象-本体……28-29
3.4图像预处理……29-30
3.5特征提取……30-31
3.6分类器培训……31-33
3.7本章概述……33-34
第四章系统要求……34-42
4.1系统功能……34-35
4.2图像采集模块……35
4.3分类器培训模块……35-36
4.4……36
4.5分类和标签模块的系统详细信息……36-40
4.6系统域模型……40-41
4.7本章概述……41-42
第五章系统概述……42-48
5.1用户交互模块……42-43
5.2图像采集模块……43-44
5.3图像特征提取……44-45
5.4分类器学习模块……45
5.5分类标签模块……45-46
5.6图像索引模块……46
5.7数据库设计……46-47
5.8本章概述……47-48

摘要
随着互联网的不断普及和第三次互联网产业革命中“云计算”的蓬勃发展,大规模数据处理已经成为研究者的热门话题之一。作为数据的重要代表,“图像”不仅能形象地描述人们在生活中看到和听到的东西,而且通过使用“图像”给人们的生活带来了方便。
基于图像的检索系统经历了从依赖文本到低级图像特征和从低级图像特征到高级图像语义的两次飞跃。然而,应用于服装场景的检索系统,为了更直接地捕捉用户的查询意图,先后出现了平移、搜索、必看谷等应用。检索以搜索“商品”的“商品图片”的形式进行。通过大量的实验发现,这样的应用仍然不能完全解决用户查询语义和图像特征之间的语义鸿沟。因此,本文提出了一种基于时尚元素自动学习的检索模型,从基本时尚元素入手,解决图像特征描述的单一性与语义丰富性之间的距离问题。