> 硕士毕业论文 > 56000字硕士毕业论文南昌数字地址编码数据库的规划与完成

56000字硕士毕业论文南昌数字地址编码数据库的规划与完成

论文类型:硕士毕业论文
论文字数:56000字
论点:地址,编码,数据
论文概述:

对国内外地址编码技术状况进行了探析,阐述目前我国地址编码技术存在的问题与不足与其建设的必要性;描述了数据库建设所引用的标准规范和要素的分类,制定了适合南昌市的逻辑框架结构

论文正文:

简介

研究背景和意义

随着中国信息产业的快速发展,地理信息系统在各个行业的应用越来越广泛,人们对信息服务的需求也越来越迫切。全球信息化正在引发当今世界的深刻变革。“数字城市”是当今我国信息技术发展的主要特征,也是城市基础设施建设不可或缺的重要内容之一。根据《2006-2020年国家信息化发展战略》和《南昌市2010-2020年总体规划》,“数字南昌”建设处于整体升级阶段。其目标是实现城市管理效率、政府行政效率和公共服务效果的整体提升,充分满足第七届城市运动会成功举办的信息化要求。
地址编码数据库系统是“数字南昌”的基础。地址编码数据库系统的建立是数字城市地理学空框架建设中最基本的任务之一。地址编码是指根据已建立的地址模型和编码规则,将自然语言描述的地址位置信息与空之间的坐标相关联,从而可以在地图上确定由地址数据表示的地理实体的位置,并且可以在地图上显示目的地。
地址编码数据在人们的日常生活中非常普遍和重要。据相关专家分析,在政府各职能部门拥有的海量业务信息中,许多部门都有一些街道、单位和住宅小区的地址以及一些具体的联系方式。然而,这些信息点无法通过文本的形式找到适当目标的位置。他们可以很好地整合这些空信息和非空信息,并在它们之间建立有效的联系,这将为城市的数字化和生活带来许多便利。例如,工商、医疗和教育可以成为坐标为空的信息。利用该技术,我们可以对工商税务管理的各种数据库进行综合分析,从而生成各种专题信息地图,如商业银行分布图、商业分布图和餐饮分布图。如果对企事业单位进行分析,可以生成各种点分布图,如学校分布图、医疗卫生分布图、图书馆分布图等。如果对房地产行业进行评估,可以生成各种专业的房地产信息分布图,如房地产分布图、社区分布图等。通过南昌市人口普查办公室各种普查数据库中详细的地址信息,我们可以对海量珍贵的普查数据进行空可视化分析,生成教育、人口普查、商业普查、住房普查、产业普查分布图,进而对房地产低价指数评价、商业选址、人口和教育布局等进行有效分析。
中国的城镇地籍管理系统、城市智能交通系统、城市综合管网、城市规划管理系统等都是采用十进制地址编码技术建立的。通过地址编码技术,许多地址名称的数字资源已经转化为广泛使用的空信息资源,为我国城市规划管理等相关部门提供了完整的数据支持。因此,城市地址编码数据库的建立和地址匹配整体的形成,可以为国家、政府部门、公众、企业和全社会提供良好的服务,也为全社会、经济和资源的可持续发展奠定良好的基础。

2国内外研究现状

2。1国外研究现状

发达国家信息数字化起步较早,发展迅速。美国是地址编码应用最早、最广泛的国家。早在20世纪60年代中期,美国就做了大量与地址编码相关的工作,以配合美国国家情报局进行的人口普查,并开发了“双独立地图编码”(DIME),极大地促进了美国地理信息系统服务。其基本思想是根据每个地理元素的拓扑关系形式来组织数据,从而构建一个地理基础文件系统。DIME系统要求街道中心线的每一段必须至少有五个元素:街道名称、街道左侧的起始地址、街道右侧的起始地址、街道左侧的终止地址和街道右侧的起始地址。街道两边的地址号码必须是双重和单一的。在随后几年的人口普查中,十项普查数据的整理、分区和调查都是以地理基础文件系统为参考系统进行的。一角硬币的研发在地理信息系统技术发展史上具有划时代的意义。一系列企业以地址编码为主营业务,雨后春笋般出现。
20世纪80年代末,为了准备1990年的全国人口普查,美国国家人口普查局将DIME系统发展成为TIGER系统。地形集成地址编码和参考系统[3-4] o TIGER数据库是1990年人口普查中使用的全国性地图数据库,包括道路、河流、铁路和湖泊等所有地理特征数据,其中有一些地理特征的非常详细的信息记录。例如,在人口普查过程中,为了方便计算机处理,必须使用地址码给划分的普查区域分配数字代码。通过使用地理信息系统将从人口普查中获得的每个家庭的信息与不同地区联系起来,可以从替代文本的名称中总结出普查的基本地理特征。
地理信息系统可用于对不同地区的分类信息进行统计分析,将从人口普查中获得的家庭和个人数据与其所在地区联系起来,并反映普查数据的地理特征。TIGER数据库的内容更新非常快。一般来说,新版本将几乎每两年发布一次,目的是以各种形式向公众提供。只需支付少量费用就可以方便地获得所需的TIGER数据。由于Tiger的综合数据库,其高精度和通用费用,TIGER已成为美国公认的地址编码参考标准,并在行业中有很大影响。
加拿大已经完成了国家地址编码数据库的建设。因为文件系统用于管理地址编码数据,所以地址编码数据库具有非常高的响应速度。当该国1.5G字节的地址编码数据量非常大时,地址匹配的时间仅为1秒。德国、以色列、澳大利亚、意大利等国早就对10地址编码技术进行了大量详细的研究工作,该项目已经投入使用。像美国一样,这些研究的结果也在行政、测绘、规划等国家的实际工作中发挥了重要作用。

3地址代码数据库.........25-51
3.1总体设计.........25-30
3.1.1设计基础.........25-26
3.1.2系统设计原则.........26-27
3.1.3逻辑模型设计.........27-29
3.1.4地址编码数据库.........29-30[/ br/] 3.2数据库结构.........30-32
3.2.1概念模型.........30 [/溴/] 3.2.2编码规则和.........30-32
3.3数据采集.........32-42
3.3.1地址编码数据.........32-34
3.3.2现场收集方案.........34-35
3.3.3字段输入.........35-37
3.3.4地名数据收集.........37-40
3.3.5门建筑数据收集.........40
3.3.6标准地址词典.........40-42
3.4地址标准化.........42-44
3.5数据质量检查.........44-45
3.5.1数据质量检查规则.........44-45
3.6数据更新.........45-47
3.6.1更新设计理念.........45-46
3.6.2.........46-47
3.7地址数据的质量和控制.........47-48[/ br/] 3.7.1对数据质量的影响.........47
3.7.2地址数据保证.........47-48 [/ Br/] 3.8数据仓库.........48-51
4地址匹配方法及匹配.........51-59
4.1中文地址分析.........51-52
4.2字符串匹配.........52-53
4.2.1字符串匹配.........52-53
4.3地址匹配方法.........53-57
4.3.1地址匹配.........54-56[/ br/] 4.3.2加权值匹配.........56 [/ Br/] 4.3.3回退匹配.........56-57
4.4使用地址相关性进行权衡.........57
4.5地址匹配引擎.........57-59

结论与展望
作为数字城市的基础,地址编码数据库系统在数字城市地理空框架的构建中起着关键作用。这既是一个技术问题,也是一个标准化问题。在分析国内外现有地址编码技术的基础上,阐述了中国地址编码数据和南昌市具体地址数据的特点,探讨了适用于南昌市的地址编码模型、数据采集方法和地址匹配方法。围绕地址编码数据库的建设、地址匹配方法和应用系统,探索了两个关键的研究突破点。结合数字南昌地址编码数据库系统的研究与实现,主要内容总结如下:
1)分析了国内外地址编码技术现状,阐述了当前我国地址编码技术存在的问题和不足以及建设的必要性。阐述了数据库建设中引用元素的标准规范和分类,制定了适合南昌市的标准数据拆分逻辑框架结构和规则,为后续研究工作奠定了基础。