当前位置: > 硕士毕业论文 > 38450字硕士毕业论文基于统计学习的P2P节点选择机制的研究与实现

38450字硕士毕业论文基于统计学习的P2P节点选择机制的研究与实现

论文类型:硕士毕业论文
论文字数:38450字
论点:节点,网络,拓扑
论文概述:

本文通过对P2P网络大流量现象的研究,对国内外研宄现状的学习,希塑可以找到一种可以减少P2P网络带宽压力、减少下载时间和占用网络流量的方法。以BT协议为越础,通过对其分析与学习,提

论文正文:

介绍

1.1研究背景和意义
随着P2P技术的广泛应用和P2P应用软件的产生,这些P2P软件的共同优势是每个节点都具有客户端和服务器的双重角色。网络中的节点随时随地加入网络,网络中的资源在计算机中随机分布,大大减轻了服务器的负担,从而提高了系统的稳定性和健壮性。然而,在P2P网络中,用户节点的随机添加和删除使得系统高度不确定,P2P网络存在很大的安全风险。P2P给文件共享带来了很多便利,但也给不同网络中的路由交换带来了很大压力,甚至影响到其他网络服务。一些调查报告显示,P2P所占用的网络流量已经大大超过了HTTP协议所占用的网络流量,占到了整个网络流量的绝大部分。由于许多P2P软件采用无记忆节点选择方法,网络数据流量主要集中在一些链路网络上,因此用无记忆节点选择使一些骨干网络负担过重将导致P2P用户在运营商网络中中继大量流量,这将导致[3号互联网服务提供商经济崩溃。许多组织对P2P的应用和信息进行了研究,发现P2P占用了大量的网络流量,P2P消耗了巨大的网络带宽,尤其是国际带宽。P2P网络产生如此大流量的主要原因是它过分强调节点之间的绝对平等。互联网上的任何两个网络节点都是相等的。例如,位于上海的节点可以通过位于上海某处的其他节点或美国的网络节点同时下载资源片段。对于用户来说,过度和随机的资源共享只能感受到下载速度的差异,但是对于网络运营商来说,跨运营商流量的成本远远高于本地流量。如果P2P节点能够优先选择本地运营商网络中的资源,不仅可以提高下载速度,还可以缓解网络的出口带宽。国内外研究人员一直致力于P2P网络的研究和学习,并提出了许多不同的方法来解决上述问题。互联网服务提供商还提出了P2P防范软件的一些应用。方法大致可分为以下三种类型:(1)互联网服务提供商分析P2P流量大的问题,总结问题产生的原因,并提出具体的预防、检测和分析方法,研究并实施相应的措施。(2)从P2P应用本身出发,修改P2P软件和P2P传输协议,避免发现提供商。(3)考虑到P2P用户和互联网服务提供商的利益,许多研究者提出了一种基于相互合作和互利的网络系统。
P2P网络中的核心技术资源搜索可分为以下三种类型:集中式搜索模型、分布式搜索模型和混合式搜索模型。Napster是集中式搜索的典型代表,它将共享信息的文件索引和存储位置等信息引入中央服务器,以降低中央服务器的带宽消耗,减少文件传输延迟。然而,Napster模型容易出现单点故障和网络瓶颈。分布式搜索可以分为结构化搜索和非结构化搜索。分布式结构化搜索主要采用基于消息传递机制和关键字杏搜索的定位方法。主流方法是分布式哈希技术。分布式哈希表技术只存储节点中相邻节点的信息,而不关心整个网络的节点信息。同时,取消了泛洪算法,保证了信息有效到达目标节点,增强了网络的可扩展性。但是分布式哈希表技术的邻居关系是由节点之间的逻辑距离决定的,缺乏实际物理网络的拓扑关系,节点的查询效率相对较低。分布式非结构化搜索的典型代表是Gnutella。网络中的资源被分配给每个节点。完全随机图泛洪算法和随机转发机制会在网络中产生大量无用信息,容易导致网络拥塞。混合搜索的典型代表是KaZaa,它结合了纯P2P去集中化和集中式快速搜索的优点。超级节点的概念是在纯P2P分布的基础上引入的。网络中性能良好的节点自动变成超级节点,可以避免一些恶意攻击,保证网络负载均衡,大大提高搜索效率。然而,KaZaa模型严重依赖超级节点,这在一定程度上影响了网络的容错能力。为了解决上述问题,基于P2P应用本身、统计原理和相似理论,提出了一种改进的混合P2P网络节点选择算法SAPS。该算法基于BitTorrent协议,收集并统计分析P2P网络中计算机节点之间的通信数据,并将物理上接近的计算机节点划分为邻居节点。下载时,可以优先分配邻居节点,从而定位流量。SAPS算法利用统计方法分析节点间的相似性,并基于邻居网络划分节点。它有效地解决了P2P网络中缺乏物理信息的问题,提高了P2P网络的整体性能,并尽可能地定位网络流量。该算法具有一定的理论意义和实际应用价值。

2 P2P简介

2.1 P2P
P2P网络的定义根据网络拓扑可以分为四类:集中式拓扑;完全分布式非结构化拓扑;全分布式结构化拓扑和半分布式拓扑。(1)集中式拓扑(Centralization topology):是指在这样的P2P网络中引入数以千计的集中式服务器,如检索服务器、心跳服务器等。网络中的节点在索引服务器上注册共享资源。其他节点通过索引服务器查询资源的位置,然后与资源节点通信。集中式拓扑的最大优势是快速的资源发现、简单的维护和实现复杂查询的能力。集中式拓扑的最大缺点是容易造成服务器瓶颈和单点故障。这个系统的典型代表是纳普斯特和梅兹。集中式拓扑模型存在一些问题,主要体现在以下几个方面:①网络安全性低、可靠性差、中央服务器瘫痪导致的网络崩溃;(2)资源索引存储在服务器上,容易引起版权问题;(3)随着网络规模的扩大,系统维护和更新成本增加。集中式结构在小型网络中有很大优势,不适合大型网络。(2)全分布式非结构化拓扑:网络中的所有节点都是随机自组织的。节点通过泛洪搜索节点和资源。节点的动态变化使网络具有良好的容错性。完全分布式非结构化拓扑也支持复杂查询,例如基于模糊的查询和多关键字查询。最典型的系统案例是Gnutella。Gnutella模型没有中央服务器,解决了网络结构的集中化问题。它具有良好的容错能力。在Gnutella网络中,节点完全相等,每个节点既是客户端又是服务器。节点之间的搜索以泛洪模式进行,并且随机行走机构受到控制。虽然TTL(生存时间)用于降低控制消息的值以控制系统消息的转发时间,但是网络开销仍然非常大。随着网络中节点数量的增加和网络规模的增大,通过泛洪节点定位方法,网络流量迅速增加,导致一些节点因资源过载而失效。在此之前,Gnutella模型的主要研究集中在改进发现算法以提高系统的发现性能以及如何构建一个高度结构化的系统上。

3节点管理机制的设计与实现.........16
3.1相关技术介绍........16
3.2设计理念........18
3.3节点管理机制SAPS设计........19
3.4本章摘要........34
4实验和结果分析........35
4.1实验平台简介........35
4.2实验环境和参数设置........35
4.3实验过程........36
4.4实验结果和分析........36
4.5本章摘要........39

结论

本文的研究背景是:随着互联网技术的发展,P2P应用得到了广泛的应用。网络中的P2P流量占总流量的大部分。大多数P2P软件使用无记忆节点选择方法,导致网络流量过度集中在不必要的链路上,一些主干网负载过大。在此前提下,提出了SAPS节点选择算法。其主要目的是通过定位P2P网络中的流量来减轻骨干网的压力。本文的具体工作包括以下几个方面:
(1)首先,介绍了研究的背景和意义以及国内外的研究现状。本文介绍了P2P网络的相关知识,研究分析了P2P应用对网络流量的影响,提出了SAPS节点算法。
(2)经过深入研究,提出了一种结合统计学习的P2P节点选择算法SAPS。该算法主要对收集到的数据集进行统计和分析,并利用相似性原理将数据集划分为多个域。
(3)在此基础上,设计了节点选择的激励机制和服务质量性能计算。在区域选择的基础上,根据节点自身的服务质量性能,优先选择节点性能好的邻居节点,从而提高节点间的传输速度。
(4)本文通过仿真实验验证了结构件设计,获得了实验结果,并对实验结果进行了客观分析。结果表明,本文设计的节点算法可以缩短系统的平均下载时间,提高系统的吞吐量。

参考
[1]亚兰库尔·贝克和丹尼·比克森。《乳胶http://sblunwen.com/jstjxlw/协议规范[》,丹斯实验室学校计算机科学与工程,耶路撒冷希伯来大学,2005年。
[2]帕克。点对点文件共享的真实情况。2004年7月。
[3]西塔拉曼和阿玛尔。表征和减轻覆盖路由中的域间策略违规。《ICNP进程》,2006年。
[4]孙鲁伟。基于P2P聚类的邻居节点搜索算法的研究与实现。沈阳:东北大学,2006。
[5]雷连红,张云飞,陈昌佳,等.铁路杂志,2004。26(5):55-60。
[6]王传书,王艺洁。基于网络延迟的P2P路由算法研究[[]。计算机科学,2007。
[7] lgasung。HHY·李。使用对等交换算法的P2P系统邻域选择策略。滑铁卢大学计算机科学学院,2004年。
[8]孙宋明,张钟秋准弦:物理拓扑感知结构化P2P网络[]。自动化技术和应用。2009.
[9]贾金康。基于检测和仿真的P2P用户和网络行为分析建模与安全研究[。北京:北京交通大学,2008。
[10]陈海涛、胡震宫、尊古黄。2005年大容量Fide发行版的并行下载算法。