开放文本无监督地理实体关系抽取

来源 :中国地理信息科学2014学术年会 | 被引量 : 0次 | 上传用户:hothook
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地理实体是国家基础地理信息数据库的基本组成部分,也是地图服务矢量化表达的重要形式,而地理信息则是有关地理实体的一切有用知识.随着传感器、定位、互联网等技术的不断发展,地理信息已经成为人们生活的必需品,在位置服务(LBS)领域发挥着重要的作用. 在解决中文的语义和空间关系抽取问题时,引入词语的位置、词长和词性重要性有利于提升基于词频统计的关键词提取方法的正确率(增长加20%)。同时,在正确率相近的情况下,本文提出的改进的权值计算方法(时间复杂度O(w))的计算效率远高于基于信息熵的特征排序算法(时间复杂度O(w2c2))。此外,关系元组的重构保证了实体关系的语义表达的逻辑性,自适应的组织形式增强了地理实体间空间关系描述的完整性,有利于提升计算机对文本的理解和认知水平。
其他文献
在区域自动气象站运行过程中,经常发现仪器不正常的现象,影响了观测资料的连续性.为了更好地做好区域自动气象站的维护工作,提高数据的质量,本文对区域自动气象站常见的电源故障、网络故障和传感器故障等故障进行了分析,阐明区域站故障的检查,应坚持“先内后外,先易后难,先软件后硬件”的原则。随着区域自动站的运行,新的故障会不断出现,除了按照规定做好维护外,还要学习一些自动站的原理知识,并在实际工作中注意总结经
随着气象观测自动化技术的不断发展,越来越多的电子设备投入使用.目前,CAWS600自动气象站在国内装备使用较为普遍,该系统为华创升达生产,通常应用于地面气象观测.本文就CAWS600自动气象站遭受雷击后,所出现的常见电源故障、地温传感器故障、采集器与计算机通讯故障等几种故障进行分析和总结,以期对今后气象站雷击故障的排除有所帮助.本文是对常见的雷击故障及解决方法进行讨论,在分析和排除故障时,本着先易
为有效支撑气象装备社会化保障信息反馈、交互、考核及评估等工作,加强科学管理水平,提高社会化保障时效,提升装备保障整体能力,亟需建立区域自动气象站社会化保障管理系统.本文提出该系统建设的主要内容、技术方案以及相关功能模块的设计思路,实现区域自动气象站维护维修社会化保障流程的高效管理和快速响应,满足社会化保障实际工作中信息快速共享交互的发展需求.
随着区域自动站的应用日益广泛和站网布局的不断扩大,大量新站点不断投入业务运行,后续的管理、维护工作成为了保障人员的主要工作之一.本文介绍了区域站的功能结构,阐述了区域自动站系统常见故障,如板卡型号错误、通讯参数错误、数据宏等中心站故障,电源电池故障、SIM卡故障、传感器等子站故障,以及个别站点网络接入故障、大量站点网络接入故障等网络接入故障的快速诊断与解决方法,以保障区域自动站系统正常稳定的运行.
2010年4月14日青海玉树发生Ms7.1地震,本次大震及其强余震发生在青藏高原巴彦喀拉地块南的甘孜-玉树-风火山断裂带.通过小波变换去除山丹、古丰台2009年12月至2010年5月地电场分钟值数据中周期为24h,12h,6h和极高频扰动成份,然后再将滤波后的信号利用全局小波能谱法进行分析,小波能谱法计算其滤波后的数据,发现:山丹台、古丰台在玉树Ms7.1地震前均发生全局小波能谱值同步增大的现象,
中强地震后短时间内发生大量余震,这些余震的记录波形相互交叠干扰并受到主震面波尾波的影响,其中一些余震波形信噪较低,通过测震台网常规分析方法只能在震中距最近的一个台站检测到较清晰的P、S波震相到时,即为单台记录地震事件.中强地震余震序列的地震目录中存在大量单台记录地震事件.地震观测报告未给出其震中位置,且给出的震级可信度较差.精确估计单台记录地震事件的震中和震级,能够补充完善现有地震目录,为余震序列
遥感图像的场景分类是学习和发现图像与场景语义内容标签的一个映射过程.根据图像特征提取的层次,场景分类可分为低层特征描述和中层特征描述的两大主流方法.基于视觉词袋模型无需分析场景具体目标组成,根据场景统计特性建立视觉单词,然后利用文本相关模型来处理图像内容的表示.考虑图像空间关系、尺度和层次关系、上下文关系可获得有效的描述场景的视觉单词.在大脑对感知外界环境的神经结构与认知功能的相关研究基础上构建仿
在宏观层面,我国城镇化已进入加速期,预计到2020年城镇化率每年将提高1~1.5个百分点,庞大建设体量的背后是节能减排和环境民生的巨大压力.在这波城镇化的加速期中,我国迎来中规模化和区域化的全国绿色建筑集中建设新热潮.这类建筑群以住宅小区和商业综合体为代表,相对单体建筑,其规划设计却存在较大的变化空间,对应着不同建筑综合性能.本研究采用归纳总结、数据抽取、程序开发等方法,基于地理信息系统,结合风、
彩色描述符在几何不变性基础上加入彩色信息提高了影像特征点的不变性以及区分度,近几年来被广泛的研究和应用.但是目前的彩色描述符主要针内容较单一的数码图片或者视频,没有考虑到航空遥感影像地物复杂的基本特征.因此将彩色信息引入成像机理不同、颜色接近地物的Bayer真彩色的遥感影像的特征描述中,其效果与适用性是一个还没有深入研究的新问题.由于文献验证了基于几何不变性中SIFT描述符具有最佳性能,文献验证了
时空热点事件可定义为一定数量的人群在特定的时间和地点共同参与的事情.这里的人群数量反映的了事件的热度、流行度.参与的人越多,事件越热门.而特定的时间和地点则表征了热点事件的时空特征.实时的跟踪人群的活动轨迹,并获取人群的活动内容是当前大数据分析的一个重要内容.然而,如何及时准确的获取人群的位置信息、活动内容,并从中有效的提取有价值的信息,是一个研究难点.本文研究了面向新浪微博签到数据的时空热点事件