当前位置: > 硕士毕业论文 > 30000字硕士毕业论文非结构化P2P网络中基于文件流行度的对等测量也是一种技术搜索机制的研究

30000字硕士毕业论文非结构化P2P网络中基于文件流行度的对等测量也是一种技术搜索机制的研究

论文类型:硕士毕业论文
论文字数:30000字
论点:节点,机制,系统
论文概述:

Squirrehl8}等利用对等计算的技术优势,很好地解决传统的Web缓存系统不能避免的硬件开销,缓存有限以及维护和运营成本指数级递增等问题。Infrasearch}l9},Pandango}2o]和Google}2}]等P2P搜索引擎与传统

论文正文:

  第一章引言          第一节课题背景在过去的几年中,采用P2P(Peer-to-Peer)技术的应用在Internet上迅速传播,用户数量急剧增长。客户/服务器(Client/Server)模式把数据存放在集中的服务器上,而在P2P应用中数据保存在对等节点上。现在,由于计算机和网络的性能都出现了飞跃性的提高,随着用户对于网络应用的需求和使用方式的改变,人们都越来越重视和关注P2P技术〔’]。P2P网络中不存在中心服务器,所有的节点既是客户机,享用其它节点提供的服务,同时又充当服务器,为其它节点提供服务。数据在对等节点之间直接传递。P2P模式能让互联网上的闲散资源得到充分的利用,提高了网络的容错性能,加快了信息的传播速度,同时也优化了网络的带宽利用情况。由于P2P模式具有的技术特点,文件共享服务[tZl成为P2P最为成功的用途之一。用户利用基于P2P的网络协议,直接从含有所需文件的对等节点下载该文件,从而摆脱了对特定服务器的依赖。应用实例包括第一代的Napster}3},第二代的Gnutella}4]和KaZaA}s]等。在分布式计算中,SETI@HOME}6]和Xenoservers}}等使用积累的能力执行超级计算机的任务。此外,随着网络规模的扩大,研究项目开始采用P2P技术来组织和存储数据,例如OceanStore}g},PAST}9}和CFS}io}等提供面向全球的数据存储服务。ICQ}11},MSN}Iz]和Skype}l3〕等不依赖服务器的性能和带宽,实现点对点的通信。Narada}l4},ALMhiS]和SCRIBE}16]等利用P2P技术在应用层实现组播功能,从而避免出现由于IP层迟迟不能部署对组播的支持而使组播应用难以进行的情况。另外,P2P技术可以帮助企业和客户间建立一种安全的网上协同工作方式,应用实例包括Grooved1}]等。          Squirrehl8}等利用对等计算的技术优势,很好地解决传统的Web缓存系统不能避免的硬件开销,缓存有限以及维护和运营成本指数级递增等问题。Infrasearch}l9},Pandango}2o]和Google}2}]等P2P搜索引擎与传统搜索方式相比,利用P2P可以充分检索网络上的所有节点,并且可以通过检测网站的变化,提高搜索引擎的可达范围和数据的刷新率。以上是P2P技术主要的几个发展方向。很多计算机公司、研究部门都认为该技术蕴涵着巨大的商业价值和技术价值,其巨大的开发空间将成为未来IT界关注的焦点。第二节论文的选题及研究意义P2P文件共享系统具有分散化、自主性强、容错性好、信息量大等优势,因而得到了快速发展。以Gnutella,KaZaA,BitTorrent等为代表的一批无结构型P2P文件共享系统,己经成为当前Internet中最重要的应用之一。在这些文件共享系统中,各种文件的分布具有很大的差异性。如果以整个系统中某个文件的副本数作为判断该文件流行度的依据,就会发现文件的流行度呈现出幂律分布[22][23]:约50%的文件拥有不到20个副本,而最流行的文件却拥有上千个副本。文件分布严重影响系统性能的表现。一方面,对于流行文件的查询,系统能够以较短的响应时间搜索到大量的结果,但结果可能远远超出需求,造成大量网络资源的浪费,导致系统的可扩展性不高;另一方面,对于稀缺文件的查询,系统在经过较长的响应时间后,可能仍难以搜索到足够多的结果,甚至搜索不到结果造成查询的失败。实际上,无论是系统可扩展性不高还是稀缺文件搜索成功率较低,都是可以得到改善的。文章【24]提出的DQ方法和B.T.LOO等在文章【25][26]中提出的方法,分别从这两种情况着手,进行了证实。目前,针对提高系统性能的研究方法,大致可以归为以下几类:1)文件流行度判定。利用探测、采样等策略,通过查询消息和返回结果的数据集合,判定要查询的文件的流行度调整查询规模。文章[[26]介绍了根据查询结果数、关键字频率、关键字对频率和采样结果来判定文件流行度的策略。GAB[2}}是一种基于Gossip协议的文件流行度判定方法,其中每个节点通过RandomizedGossip方式与其它节点交互信息。2)搜索机制改进。RandomWalks[28},ExpandingRing[2g},RoutingIndices[29}等改进Gnutella协议的机制,能够减少网络流量,提高P2P系统的可扩展性,但往往又导致节点覆盖率低、响应时间增大等不足。3)索引缓存机制。节点通过索引其它节点的信息、缓存流经的查询结果,提高搜索性能。  参考文献[1〕杨波.P2P的现状及发展趋势研究.技术报告,中国互联网研究室,2004.陈洪,刘双与,杨玉华.P2P技术发展与应用.计算机工程,2003 Vo1.29, No.19: 7478.  Napster.   Gnutella.   KaZaA.   SETI@HOME.  D.Reed,  LPratt,  P.Menage,  et  al.  Xenoservers:  Accounted Execution of UntrustedCode. Proceedings of Workshop on Hot Topics in Operating Systems HotOS}  1999.   Sean Rhea, Chris Wells, Patrick Eaton, et al.  Maintenance-Free Global Data Storage. IEEEInternet Computing, Sep/Oct 2001: 121一128.  摘要 4-5 Abstract 5 第一章 引言 9-13     第一节 课题背景 9-10     第二节 论文的选题及研究意义 10-11     第三节 本文研究内容 11     第四节 论文结构 11-13 第二章 P2P网络概述 13-21     第一节 P2P概念 13     第二节 P2P特点 13-15     第三节 P2P文件共享系统 15-19         2.3.1 集中式P2P文件共享系统 16         2.3.2 分布式无结构化P2P文件共享系统 16-17         2.3.3 分布式结构化P2P文件共享系统 17-18         2.3.4 三类P2P文件共享系统比较 18-19     第四节 P2P网络行为特征 19-21 第三章 改进的Gnutella文件搜索机制 21-34     第一节 Gnutella协议简介 21-27         3.1.1 Gnutella系统特性 21-22         3.1.2 Gnutella协议定义 22         3.1.3 Gnutella消息格式 22-25         3.1.4 Gnutella加入机制和洪泛搜索机制 25-27     第二节 基于TTL的搜索机制 27-31         3.2.1 无指导查询 28-29         3.2.2 指导查询 29-31     第三节 基于预算的搜索机制 31-33         3.3.1 预算机制 31-32         3.3.2 AntBudget搜索机制 32-33     第四节 本章小结 33-34 第四章 ERAB搜索机制 34-48     第一节 预算分配 34-35     第二节 信息素索引表 35-36     第三节 信息素更新策略 36-39     第四节 ERAB搜索过程 39-45         4.4.1 范围扩张策略 39-41         4.4.2 搜索的结束条件 41-42         4.4.3 ERAB中的消息转发与丢弃 42-44         4.4.4 搜索过程的两个阶段 44-45     第五节 消息类型 45-46     第六节 本章小结 46-48 第五章 DDAB搜索机制 48-60     第一节 基本思想 48-51     第二节 基于探求的适应性预算设置 51-53     第三节 DDAB搜索过程 53-59         5.3.1 搜索过程的两次查询 53-55         5.3.2 搜索的结束条件 55         5.3.3 DDAB消息处理 55-56         5.3.4 DDAB机制与ERAB机制的比较 56-59     第四节 本章小结 59-60 第六章 模拟实验和性能评价 60-84     第一节 实验方法 60-64         6.1.1 性能指标 60-61         6.1.2 参数设置 61-64     第二节 ERAB机制性能评价与分析 64-72         6.2.1 范围扩张策略的性能 64-65         6.2.2 加速率β的调节效果 65-69         6.2.3 综合性能比较 69-72     第三节 DDAB机制性能评价与分析 72-82         6.3.1 探求查询的性能 72-75         6.3.2 DDAB、ERAB和AntBudget的比较 75-82     第四节 信息素索引表的空间代价 82-83     第五节 本章小结 83-84 第七章 总结与展望 84-85     第一节 论文总结 84     第二节 进一步的工作 84-85 参考文献 85-89