> 论文范文 > 41000字论文范文网络文本地理信息变化语义检测方法研究

41000字论文范文网络文本地理信息变化语义检测方法研究

论文类型:论文范文
论文字数:41000字
论点:地理信息,变化,要素
论文概述:

第1章绪论 1.1研究背景与研究意义 随着当前生活节奏的加快和互联网技术应用的普及,地理信息已悄然成为百姓出行、社交等地方中不可或缺的部分。地理信息对地物现状描述的准确性和时效

论文正文:

第一章引言

 1.1研究背景与研究意义随着当前生活节奏的加快和互联网技术应用的普及,地理信息已悄然成为百姓出行、社交等地方中不可或缺的部分。地理信息对地物现状描述的准确性和时效性直接影响到地理信息服务的质量。我国城市发展迅速,缺乏从规划到建设的信息共享机制,导致地理信息更新问题滞后严重。地理信息更新是指将现有地理数据与具有较强现势性的测绘数据、遥感影像等资料进行比对,在发现和确定地理信息要素空间及属性变化的基础之上,对原有地理信息数据进行相应的修改,以保证地理信息数据的现势性_。目前,测绘部门已经完成了基础地理信息数据库的“初始建库”,基础测绘的工作重点已转向持续更新和灵性服务,地理信息的更新模式也转变为“应需适时更新”。关注要素更新,保证更新信息的准确性、时效性是当前地理信息更新的最迫切需求,“地理空间信息更新将取代数据获取成为GIS建设的瓶颈”。地理信息变化检测是进行地理信息更新的前提。现阶段,外业测量、遥感影像识别等传统变化检测方法难以对地理要素变化情况快速响应,实现更新周期适时化、更新内容灵活化的“应需适时更新”目标。调查研究表明,未来的人机交互95%将采用文本语言,且80%以上的文本中涉及地理信息描述。Wikimapia创建时已有480多万个条目,描述从城市到个别建筑物的各种类型地理要素。引人注目的是,人人网、开心网、Twitter、Facebook等社交网络平台的不断涌现,使得地理信息逐渐具有社会化网络的某些特征。总体上来说,社会化网络中的信息具有以下特征:1)时效性好。社会化网络内容的更新几乎是实时的,新闻无论大小都会迅速在社会化网络中传播。2)可信度高。由于社会化网络真实地来源于现实生活,使得人们的线上活动和线下生活紧密相关,并逐渐成为用户沟通和交流的平台。3)地理信息丰富。随着具有GPS等定位功能的移动设备功能的提升,基于位置的应用曰益丰富,在社会化网络中出现了越来越多的地理信息。4)更新不受时间地点限制。随着GPRS和3G网络的普及,使用移动终端进行相关信息的更新已打破了传统条件限制,做到了更新360°无死角。中国互联网络信息中心(CNNIC) 2012年1月发布的《第29次中国互联网络发展状况统计报告》指出,2011年底网络新闻使用率位居各类网络应用的第四位,手机网民占整体网民比例的69.3%,微博使用率增长迅速,其中手机微博成为增长最快的手机应用。因此,互联网中以自然语言方式存在的地理信息完全可以作为地理信息数据更新的数据源,为导航数据的更新、个性化的位置服务提供数据支撑,为地理信息的更新工作服务。国家测绘地理信息科技发展“十二五”规划中明确将“互联网地理信息智能探测跟踪与变化分析关键技术”作为测绘地理信息发展的重要课题;国家测绘科技项目“网络地理信息变化检测技术研究(2012-2013)”也展开了网络地理信息变化语言的表达规范、网页获取、文本信息抽取和语义匹配等技术研究与试验验证工作。 1.2国内外研究现状 1.2.1地理信息变化检测方法研究 1.2.1.1实地调绘方法实地调绘是最古老的变化信息获取和釆集方法。该方法通过到要素所在地进行走访调查或者实地测量[6],将所得数据与地物的历史数据进行比对,以判断地物是否发生了变化。根据测量工具或使用终端可将实地调绘细分为三种:1)基于尺的测量方法。适用于发生变化区域较小或地形相对较简单地域变化信息的采集。2)以全站仪和GPS为终端的测量方法。GPS系统始于20世纪70年代,由美国国防部批准研制。近年来,随着GPS可用性、可靠性和安全性的提高,GPS系统开始广泛应用于高精度的大地测量等诸多领域,其中比较突出的是利用移动终端的数据釆集系统(Mobile Mapping System,MMS)。比如,美国俄亥俄州立大学制图中心的Gpsvan、加拿大伏加里大学地理信息工程系的Visat和武汉大学的LEADER 2000。世界银行资助的太平洋运输部门也开展了将GPS应用于道路数据采集的相关研究并将利用车载GPS进行数字地图中道路数据的拓扑变化检测变成了现实[8]。国内,李德仁院士认为,车载GPS道路信息釆集有着极其广阔的发展前景[9]。西安测绘研究所研制的车载GPS交通数据获取与更新系统已经应用于全国公路网GPS测绘工程和野战地图修测车中,利用GPS和全站仪联合作业的方式进行外业数据的采集为其它地区地理信息的更新提供了借鉴[\">]。3)基于PDA的测量方法。随着移动信息设备和嵌入式技术的不断发展,出现了另一种移动终端数据采集设备——PDA。美国地质调查局1998年开始了 PDA在地质填图和地质构造数据采集上的应用研究。国内外众多著名相关研究机构和企业也开始陆续研发基于PDA的地理信息数据采集平台,比较典型的有:........ 第2章地理信息变化语义检测知识库构建 地理信息要素在自然和人为的影响下都在发生着或大或小的变化,当这些变化被发觉时,网络上便很快有了关于这些事件的报道。这些报道中蕴含大量地理信息变化信息。地理信息变化语义检测知识库是进行地理信息变化知识获取和推理的基础,知识库中知识的完备性直接决定了本文构建的基于知识库系统的性能。地理信息变化语义检测知识库的建立不仅仅是地理信息变化领域知识的简单罗列,还包括地理信息变化领域知识的表达、推理和维护等方面。一般来说,完整知识库的构建流程主要包括以下流程:知识领域和范畴的确定、知识的收集和分析、知识概念和关系的确定、知识库的构建。本章将具体阐述利用Prot扭6 4.2工具构建地理信息变化语义检测知识库的方法。 2.1地理信息变化语义检测知识库内容分析地理信息变化语义检测主要针对网页文本进行,因此相关网页的获取是本文的研究重点。通过对大量相关网页分析得知,网页中与地理信息变化相关的信息一般包括五个要素:时间(When)、地点(Where)、空间关系(What Relationships)、变化要素(What Elements )、要素变化类型(What Kinds of Update )(参见图 2.1),表示何时与何地为何种空间关系的何种要素发生了何种类型的变化,简称“5W”。因此,在进行相关网页获取时,可以借助“五要素”进行。......... 2.2地理信息变化语义检测知识库内容收集 2.2.1地理信息变化语义检测领域词汇总结 (1)地理信息要素特征词汇地理信息要素是变化发生的主体,其要素种类多、涉及范围广,且不同用途的要素分类方法也不相同。此外,网页中阐述的地理信息要素尺度也存在很大差异。因此,本文在对网页中地理信息要素分类时,首先分析调研了网页文本中地理信息要素出现的频率和语言表述特点,然后在参照《GBT 13923-2006基础地理信息要素分类与代码》中大类分类标准的基础上,选取水系、居民地及设施、交通、管线四个大类,对各类别中对应的要素特征词汇和典型要素进行了总结。其中,特征词汇为一级词汇,典型要素为二级词汇。表2.2列举了其中部分特征词汇和其对应的典型要素。需要说明的是,由于网页中地理信息要素的尺度不一致,因此,本文在进行大类划分之后并没有进行更加细致的中类、小类划分。......... 第3章地理信息变化网页文本获取和信息解析........27 3.1地理信息变化网页文本获取...........27 3. 2地理信息变化网页解析............35 3. 3地理信息变化网页可信度计算.........37 3.4地理信息变化要素信息抽取.........39 3.5 小结...........48 第4章原型系统与实验验证........49 4.1 系统体系架构........49 4.2 系统主要功能........50 4. 3 实验验证与分析........58 4.4 小结..........62  第4章原型系统与实验验证 本章在对面向网页文本的地理信息变化语义检测方法研究的基础之上,借助富客户端技术,设计并研发了面向网页文本的地理信息变化语义检测原型系统,实现了变化信息的获取和电子地图与空间分析功能,并以南京地区为例,对本文提出的相关技术和方法进行了实例验证。 4.1系统体系架构系统采用典型的三层体系架构,包括数据层、中间层和表现层。通过服务形式发布和调用相关数据,以有效提高系统的灵活性,有利于与相关业务数据库和业务系统的集成(参见图4.1)。....... 第5章结论与展望 5.1结论“应需适时更新”是新形势下地理信息更新的新要求。本文紧密围绕该要求,研究了面向网页文本的地理信息变化语义检测方法。在制定了地理信息变化语义检测技术流程的基础上,深入探讨了领域知识库构建模式、地理信息变化网页在互联网中的分布特点、最佳检索关键字组合、网页文本解析和网页可信度计算模型,最终通过相应原型系统验证了本文提出方法的可行性。本文主要研究内容与结论如下:(1)通过人工归纳总结的方式建立了地理信息变化领域词典和词典间关系,并利用Prot6g6实现知识库的构建,为全方位获取相关网页文本奠定了基础。本文构建的知识库与系统相分离,知识库独立性高,但由于知识库釆用人工归纳总结的方式建立,导致本文知识库在数据全面性方面存在一定缺陷。 (2)以网络文本为数据源,制定了从“网页获取-网页解析-可信度计算-信息抽取”的相关信息获取流程,实现了地理信息变化信息的获取。但由于网页文本的海量性、歧义性、复杂性、非结构化和目前自然语言处理技术等方面的局限,造成了获取的地理信息变化信息准确率偏低。(3)在实现上述研究的基础之上,通过开发相应原型系统对面向网页文本的地理信息变化语义检测方法的可行性进行了验证。实验结果表明,不同地理要素类型的变化信息在网页文本中的出现频率差异较大,且大多数从网页文本中获取的地理信息变化属性为定性描述,具有较强的模糊性和不确定性,需要结合其他地理信息数据源进行进一步验证。因此,本文提出的方法尚无法取代当前任何变化检测方法,只能成为当前其它变化检测方法的辅助手段,共同为地理信息更新工作服务。......参考文献(略)