> 硕士毕业论文 > 24332字硕士毕业论文军事理论论文参考模型——军事敏感信息搜索系统研究

24332字硕士毕业论文军事理论论文参考模型——军事敏感信息搜索系统研究

论文类型:硕士毕业论文
论文字数:24332字
论点:索引,检索,系统
论文概述:

通过对该系统的需求分析,特别是对用户界面和 Web 模块的需求分析,确定了进行设计的基础。并在此基础之上给出了系统的总体设计,和所需数据库表的设计,并着重对所负责的用户界面模块

论文正文:

总结
1.1研究背景
现代社会日益增长的信息使得人们从海量的信息中获取他们想要的信息成为一个新的挑战。这也导致了搜索引擎的不断发展,成为人们寻找信息的首选工具,最常用的搜索引擎如谷歌、百度等。随着谷歌的成功,世界似乎突然开始关注搜索引擎领域。在一个非常智能的时代,各种搜索服务席卷了整个互联网。在不断的发展中,随着搜索引擎市场经济价值的不断提高,许多公司都在专注于开发自己的搜索引擎。从谷歌和雅虎搜索引擎,到百度,瞽叟,微软,8848购物搜索和其他各种各样的搜索引擎,现在都非常流行,几乎同时出现。尤其是由于网络2.0的持续流行,网络中的信息量翻了一番并迅速扩大。用户对搜索引擎的需求不断增加,导致几乎每个网站都增加了符合自身功能的搜索功能。这也是为什么搜索引擎技术一直是各类技术人员关注的一个重要原因。
与此同时,信息时代也有很多信息,这些信息通常以各种形式存在,如信息报告、电子邮件、文章、记录等。如何从需要的信息中提取敏感信息资源中的有用信息已经成为[1]研究的热点内容。特别是在信息化建设过程中,军队、信息是战争的先导,信息的高效、准确或不顺畅是生命线,直接影响到业务决策、指挥、通信等重要环节。然而,考虑到军事应用本身的特殊性,通用搜索引擎在准确获取信息时必须满足以下条件。
首先,及时性。在军事信息系统中,对敏感信息的时间性能有严格的要求。系统不仅需要能够快速创建网络信息的索引,而且能够及时提供所需的查询。
第二,独立。对于系统来说,它建立的索引库应该是相对独立的。
特别是,它独立于商业图书馆。索引的创建将消耗大量资源,并且没有独立性,这将对业务库的性能产生负面影响。
第三,扩张。在各种军事应用中,可能存在各种格式的信息。它绝不仅仅是WORD、PDF和其他众所周知的格式化文档。有一些特殊的文件格式是完全可能的,最典型的是:复杂的网页格式,等等。系统必须能够有效地检索这些不同格式的信息。
第四,专业精神。在军事信息化过程中,由于不断发展,许多新词逐渐产生,这些词往往高度专业化。系统还应该能够更准确地识别这些新单词:
第五,跨平台。因为信息系统处于网络化环境中,所以它们面临不同的平台系统。因此,系统应该支持不同的平台以实现查询,从而满足军队联合和战争联合的各种需求。
1.2研究现状
对于搜索引擎的研究,当前网络中最常见的搜索系统是各种面向互联网的搜索系统。这种系统的典型特征是它的索引库不同于系统自己的业务库,可以充分利用它来实现军事系统所要求的独立性。同时,这种系统的基本工作模式是依靠网络蜘蛛或机器人在网络上不断获取网页信息。由于网页数量庞大,不可避免地会给系统的索引建立带来困难,使得其更新速度往往较慢。在这一点上,军事应用的紧迫性无法得到满足。除了面向互联网的检索系统,还有另一种所谓的面向数据库的检索方法。由于它的索引经常存储在数据库中,不能满足实时性的要求。虽然可以采用一定的机制来提高其实时性,但系统在创建索引时不可避免地会对数据库的效率带来实质性的影响,并失去其独立性。另外,由于数据库本身的特点,数据库检索组件不能很好地满足扩展性和专业性。此外,基于传统手工检索的方法,包括图书馆普遍存在的文献检索方法,已经不能满足信息发展带来的检索需求。
正是考虑到上述因素,全文检索技术才逐渐形成和发展了[1】。其技术的核心是全文搜索,这基本上意味着记录在所有文件索引数据库中的信息的出现是所有基本元素的来源。此外,与英文全文搜索相比,自然语言系统因不同的索引机制而不同。在英语中,单词被用作建立索引的单位。英语单词是不相关的字母,而汉语中最小的单位是单词。此外,英语单词使用空大小写和标点符号作为分隔符,汉字之间没有自然分隔符。因此,实现中英文全文搜索更加困难。
中文系统有两种基本的索引数据库结构,即基于图书馆的索引词汇和基于图书馆的词汇索引。双方在指标组织上各有利弊。国内学者关注前者,该方法实用、易于直观建立,但检索速度不高,查全率和查准率不尽人意。后者具有较高的检索速度和准确性,但当汉语词汇容易出现歧义时,有必要建立和维护一个词典。近年来,随着全文索引技术的发展,控制技术和人工智能技术被引入全文索引。智力理论的研究分为两个方面。在介绍检索的基础上,一是智能生产,其机制主要是指以智能的方式形成和指导具体的研究工作。另一方面,是如何自动实现人工模拟,特别是智能的扩展和扩展。
第二章关键技术分析...................5
2.1搜索引擎技术分析……5
2.2朗讯技术分析……7
2.3全文检索技术分析……8
2.4中文分词技术分析……11
2.5本章总结...................12
第三章军事敏感信息搜索系统需求分析...................13
3.1总体需求分析……13
3.2用户界面模块需求分析……17
3.3本章总结……17
第四章军事敏感信息搜索系统的设计……18
4.1总体设计……18
4.2用户界面和网络模块设计...................22
4.3数据库设计...................28
总结与展望
本文对建立军事敏感信息搜索系统所涉及的技术进行了全面的研究。本文重点介绍了搜索引擎技术、全文检索技术和中文分词技术的发展历史。通过对Lucene技术、全文检索中的索引技术、中文分词算法以及面临的问题等关键技术的研究,为下一步建立军事敏感信息搜索引擎系统奠定了理论和技术基础。
然后在此基础上,通过对系统需求的分析,特别是对用户界面和网络模块的分析,确定了设计依据。在此基础上,给出了系统的总体设计和所需数据库表的设计,并着重设计了负责任的用户界面模块和网络模块,为下一步的具体实施奠定了基础。
参考
[①邱哲,傅勇。. Lucene2.0+Heritrix开发了他的搜索引擎,第2版,人民邮电出版社,2007。
[2]切东。向应用程序添加全文检索功能Lucene简介,一个基于Java的全文索引引擎2003。
[3]阿帕奇雅加达http://sblunwen.com/jslllwdx/项目;Lueene.2005
[4]张孝感、金玉玲、侯立波。基于Lucene检索引擎的全文数据库的研究与实现。信息检索技术,2005 (2): 40-43
[5]朗·肖伟,王仲康。基于Lucene的全文检索系统的研究与开发。计算机工程,2006,32 (4): 94-96。
[6]李刚,邱哲魏松。。Ajax+Lucene建筑搜索引擎。第一版。人民邮电出版社,2006
[7]中文全文搜索网。
[8]周文帅,苏峰。中文分词技术的研究现状及应用前景。山西师范大学学报(自然科学版),2006,20 (1): 25-29
[9]王志进,贾福新,郑红军等译。现代信息检索。第一版。北京:机械工业出版社,2005
曹元达、贺海军。全文索引技术的研究与实现。计算机工程,2002,28 (6): 260-262