> 开题报告 > 4543字开题报告软件工程论文开篇报告范文:分布式系统的升级和数据迁移研究

4543字开题报告软件工程论文开篇报告范文:分布式系统的升级和数据迁移研究

论文类型:开题报告
论文字数:4543字
论点:分布式,系统,本文
论文概述:

本文为软件工程论文开题报告范文,以“分布式系统的升级和数据迁移问题研究”为例介绍了软件工程论文开题报告的写作方法。

论文正文:

分布式系统的升级和数据迁移研究
开幕报告
内容
一、选题背景
二.研究的目的和意义
第三,本研究涉及的主要理论
第四,本文的主要内容和研究框架
(一)本研究的主要内容
(2)本文的研究框架
五、写作大纲
六、本文的研究进展
七、读过的文学作品
一、选题背景
当今的互联网服务正面临许多挑战和不断变化的需求,包括管理大量数据和为快速增长的用户群提供可持续和可靠服务的需求。这里提到的互联网服务包括例如在线邮箱、搜索引擎、在线游戏、在线金融系统、内容分发网络、文件共享网络等。因此,能够提供这些互联网服务的系统通常非常大:它们由数百台机器组成,这些机器可能在同一个数据中心,也可能分散在不同的数据中心,并通过独立的网络相互通信。在具有如此巨大可扩展性的集群中,错误的发生非常普遍:一些机器可能在任何时候遇到硬件或软件故障;网络延迟和网络故障可能随时发生,导致数据包丢失、网络分区等。意外的恶意攻击或操作错误也可能导致不可预测的灾难性错误。因此,用于构建这样一个系统的软件通常非常复杂。与此同时,系统偶尔需要修改(升级)以提高性能、修改错误或添加新功能。这项工作面临的最基本问题是如何有效地设计一个工程上可行的升级方案,使这种规模的分布式系统能够在升级过程中持续提供服务。
二.研究的目的和意义
目前,云计算非常流行。各种互联网公司、银行和政府经常提到云计算,各种分布式系统层出不穷。无论是Hadoop、开放堆栈、蒙古数据库等大型分布式产品的著名开源项目。,或者是国内外著名的云计算服务提供商亚马逊AWS、微软Azure和阿里云,云计算已经从纸质或宣传口号走向真正的登陆阶段。然而,对于云计算或分布式系统中更具体的问题,尤其是国内相关领域的相关研究相对较少。国内工业中的著名制造商似乎都在默默地制造汽车,并且仍然很少有论文和研究成果共享来解决云计算工程中的实际具体问题。我知道我的能力有限,我只受益于研究生期间的一些实习经历。结合工程实践,尝试对分布式系统升级和数据迁移问题做一些总结和提炼工作,并有一定的创新。
第三,本研究涉及的主要理论
分布式系统是一种软件系统,其组件分布在联网的计算机上,组件通过传递消息来通信和协调它们的动作[2]。分布式系统是一个通用名称。常见的有分布式操作系统、分布式编程语言及其编译(解释)系统、分布式文件系统和分布式数据库(存储)系统等。本文面临的升级和数据迁移问题涉及到更多的分布式存储系统,其定义如下:分布式存储系统是通过互联网互联的大量普通PC机服务器,为整个外界提供存储服务。也可以说,那些为数据存储和访问而设计的分布式系统被称为分布式存储系统。与普通软件系统不同,分布式存储系统具有以下特征。了解这些特点对解决本文提出的问题具有重要意义。可扩展性:分布式存储系统的可扩展性是最重要的优势,它通常可以扩展到数百个单元。同时,随着集群规模的增长,系统整体性能呈线性增长。此外,根据某些策略,数据和请求可以分布到不同的物理节点。物理节点的数量与集群的处理能力成比例。集群是线性可伸缩的。同时,集群能否扩展以及能否线性扩展是衡量分布式存储系统的一个重要指标。低成本和高性能:分布式存储系统具有自动容错和自动负载平衡机制,使其能够构建在普通PC机上。此外,线性扩展能力也使机器的增减变得非常方便,可以实现自动操作和维护。因此,分布式存储系统对整个集群具有高性能。数据分布:分布式存储系统和独立存储系统最大的区别在于,它可以按照一定的方法对数据进行切片,不同的物理节点分布不同的数据切片,从而将系统的存储容量压力和访问请求压力分配给系统集群的每个物理节点,使整个系统能够存储超大量的数据,并接受更多的并发请求。那么,如何将数据分发到多台服务器上,以确保数据的均匀分发呢?数据分发到多台服务器后,如何实现跨服务器读写操作?有两种常用的数据分片和分发方法:一、哈希分区方法,即根据数据的键(Key),哈希被模块化并离散地分发到集群的物理节点,亚马逊的Dynamo使用一致的哈希算法进行分区;b .连续分割法(continuous partition method),即根据关键字对整个数据集进行排序,并根据关键字的范围进行切片。
第四,本文的主要内容和研究框架
(一)本研究的主要内容
本文共分六章,主要内容如下:
第一章是绪论。本文介绍了本文的研究背景,简述了云计算和分布式系统的现状,系统升级的必要性,以及本文的主要工作和组织结构。
第二章是文献综述。摘要:介绍了与分布式系统相关的基本理论,分析了一些典型的Nosql系统,总结了单机软件成熟的升级方案和以前关于分布式系统升级的一些研究成果。
第三章是难点分析和总体设计。本章系统分析了分布式系统升级的难点,提出了高可用性分布式系统升级设计的基本概念和原则。在此基础上,提出了该问题的总体设计方案。
第四章是详细的设计与实现。本章在前一章的基础上,依次详细设计了单个数据中心和跨数据中心的分布式环境下的系统升级方案,这是本文的重点章节。
第五章是方案的测试和实施。在详细设计和实现的基础上,本章提出了相应的测试和实现方案,并通过测试分析和实验分析验证了升级方案的有效性。
第六章是总结与展望。本文总结了论文所做的工作,指出了论文的创新点,并展望了论文的不足和未来的后续研究。
(2)本文的研究框架
本文的研究框架可以简单表达如下:
五、写作大纲
概要4-5
摘要5-6
第一章导言9-11
1.1研究背景9
1.2本文的主要工作是9-10
1.3本条的组织结构10-11
第二章文献综述11-23
2.1分布式相关理论11-14
2.1.1基本概念和特征11-12
2.1.2资本充足率理论12-14
2.2典型Nosql系统分析14-19
2.2.1大表15-16
2.2.2发电机16-18
2.2.3卡珊德拉与大桌子和迪纳摩的比较18-19
2.3独立软件升级计划19-21
2.4分布式系统升级方案21-22
2.5本章总结22-23
第三章难度分析和总体设计23-32
3.1升级分布式系统的困难分析23-25
3.2高可用性分布式系统升级设计25-27
3.2.1升级设计的基本概念25-26
3.2.2升级设计的基本原则26-27
3.3总体设计方案27-31
3.3.1方案背景27-28
3.3.2程序步骤28-30
3.3.3亮点30-31
3.4本章概述31-32
第四章详细设计和实施32-51
4.1项目背景介绍32-33
4.2单数据中心分布式系统升级33-38
4.2.1设计意义33-34
4.2.2详细设计34-38
4.3跨数据中心的分布式系统升级38-42
4.3.1差异分析38
4.3.2概述38-39
4.3.3读写请求的处理39-40
4.3.4详细步骤40-42
4.4主要模块42-49的实施
4.4.1整体模块设计42-44
4.4.2主要模块的升级44-46
4.4.3数据迁移模块46-48的实施
4.4.4回调函数的实现48-49
4.5本章概述49-51
第五章方案实施和测试51-70
5.1方案执行51-57
5.1.1系统部署51
5.1.2外部接口51-52
5.1.3升级操作流程52-57
5.2方案测试57-66
5.2.1单元测试57-61
5.2.2集成测试61-63
5.2.3系统测试63-66
5.3实际生产环境测试结果66-69
5.4本章总结69-70
第六章总结与展望70-72
6.1审查和总结70-71
6.2前景71-72
参考文献72-74
致谢74
六、本文的研究进展(略)
七、读过的主要文献
[1]阳传会。大规模分布式存储系统的原理分析和体系结构实践[。2013.
[2]库鲁里斯,乔治;让·多利莫尔;蒂姆·金德伯格;戈登·布莱尔(2011)。分布式系统:概念和设计(第5版)。波士顿:爱迪生-韦斯利。ISBN 0-132-14301-1。
[3]哈特尔德;路透,A. (1983年)。“面向事务的数据库恢复原则”。美国计算机学会计算调查15 (4): 287。doi:10.1145/ 289.291。编辑这四个属性:原子性、一致性、隔离性和持久性(ACID),描述了事务范例的主要亮点,它影响了数据库系统开发的许多方面。
[4]埃里克·布鲁尔,《12年后的CAP:规则是如何改变的》,IEEE Explore,第45卷,第2期(2012年),页。23-29。
[5]阿曼多·福克斯和埃里克·布鲁尔,《收获、产量和可扩展容忍系统》,继续。第七届操作系统研讨会热门话题(热门操作系统99),IEEE计算机科学,1999年,第页。174-178。
[6]MSBI # 72–商业智能# 5–大数据# 2–什么是大数据?什么是无SQL?微软与SQL Azure、Windows Azure、大数据和无SQL的关系是什么?
[7]诺什尔。维基百科。http://zh.wikipedia.org/zh-cn/No SQL。
[8]张,费伊等,“大表:结构化数据的分布式存储系统”计算机系统上的自动计算机管理交易(TOCS) 26.2 (2008): 4。[9]朱塞佩·德·坎迪亚、德尼兹·哈斯托伦、马丹·贾姆帕尼等。迪纳摩:亚马逊的高可用性关键价值商店。
[10]拉克什曼、阿维纳什和普拉珊特·马利克。\"卡珊德拉:一个分散的结构化存储系统.\"操作系统评论44.2 (2010): 35-40。
[11]卡拉·卡伦和苏布·苏伦。\"大桌子、迪纳摩和卡珊德拉——评论.\"。
[12]范德堡、桑德、伊尔科·多尔斯特拉和梅林德·琼格。\"分布式系统的原子升级.\"第一届软件升级热点国际研讨会会议录。ACM,2008年。
[13]伊尔科·多尔特拉。纯功能软件部署模型。荷兰乌得勒支大学理学院博士论文,2006年1月。
[14]埃里克·福斯特-约翰逊。红帽转速指南。约翰·威利父子公司,2003年。
[15]伊尔科·多尔特拉、伊尔科·维塞尔和梅林德·琼格。将内存管理原则强加于软件部署。正在进行。26号国际机场。糖膏剂《软件工程》(ICSE,2004),第583-592页。IEEE计算机学会,2004年5月。
[16]阿杰马尼、萨梅尔、芭芭拉·利科夫和柳巴·施莱拉。\"分布式系统的模块化软件升级.\"面向对象编程。柏林海德堡斯普林格出版社,2006年。452-476。
[17]阿杰马尼,萨梅尔。\"分布式系统的自动软件升级(博士论文).\"(2005年)。
[18]贝利,爱德华·c .(2000年)。“附录一:转速文件的格式”。最大转速:将红帽包管理器发挥到极限。红帽公司,第325-336页。ISBN 978-1888172782。检索于2010年11月22日。
[19]亨特,帕特里克等人,“动物园管理员:互联网规模系统的无等待协调”USENIX年度技术会议。第8卷。2010.
[20]罗伊·托马斯菲尔丁(2000)。“第五章:表征状态转移”。架构风格和基于网络的软件架构设计(博士学位)。加州大学欧文分校。
[21]安德鲁,h,大卫,t,程序员在三部曲第二部分练习单元测试。Java版使用JUnit,陈朱伟,陶文怡,电子工业出版社,2005。