基于条件随机场模型的中文地址分词研究

来源 :测绘与空间地理信息 | 被引量 : 0次 | 上传用户:lpy2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地址分词是实现地理编码的重要基础。本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词。文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别。
其他文献
大气可降水量(PWV)在研究全球气候变化和数值天气预报中扮演着关键角色。然而,目前PWV的垂直改正主要依靠简单的经验改正模型,在一定程度上限制了多源水汽产品的高精度融合及不同水汽产品相互比较的可靠性。本文针对中国地区地形起伏大、气候多变等特点,利用2012—2017年欧洲中期天气预报中心提供的ERA5再分析资料,按全国、地理分区方法分别构建了顾及时变递减因子的中国大陆地区PWV垂直改正模型(简称为
为了探究在湖北省荆州市生态护坡中采用冷、暖季草种混播的可行性,找出一种能够提高植被混凝土草坪整体抗逆性和使用寿命的冷暖草种搭配方案,为荆江大堤的生态固防提供便捷的技术支持,将冷季型草种公园早熟禾(Poa annua\'Park\')、正义高羊茅(Festuca elata\'Justice\')和暖季型草种普通未脱壳狗牙根(Cynodon dactylon)、日本结缕草(Zoysia japonica)按50%+50%比例混播在植被混凝土上,其中同季型的2种草种间又按0+50%、12.5%
地名地址匹配引擎是连接地理信息与其他数据的桥梁,在智慧城市建设中发挥着至关重要的作用,但已有的地名地址数据库已经无法与当前城乡建设快速发展的实际情况相适应。为解决地名地址信息变化快、数量多但地名地址信息采集更新滞后的问题,本文基于有限地名地址信息,设计了以层级地址模型为基础的地名地址匹配算法,优先针对已有的标准地址进行精准匹配,对地名地址库中缺失的地址或非标准地址参照已有标准地址进行插值计算,实现
随着智能手机在日常生活中的普遍应用,相关的程序设计课程引起了很多人的重视。测绘类专业的数据采集、数据处理和管理工作可以通过智能手机进行。智能手机程序设计方法多样,内容很多,建议在课程建设中以基于HTML5语言的开发技术为主,并综合介绍其他方法。以前方测角交会计算为例,利用HTML5技术开发出网页程序并可以在智能手机上运行。
采用单像空间后方交会算法求解相机的外参数是摄影测量及机器视觉等领域的基本问题。在介绍前人研究成果的基础上,提出一种新的单像空间后方交会算法,即利用3个控制点建立临时坐标系,根据这些控制点在临时坐标系下的部分坐标分量为0的特点,将后方交会求解转换为三元二次方程组的求解,3个控制点的图像坐标数据可为非线性方程组的迭代求解提供初始值,使求解过程更加可靠。利用某商用工业摄影测量系统对实验空间中布设的控制场
当前人口集聚影响因素的研究多基于单因子影响力探讨,多因子及其交互作用方面的研究相对较少。鉴于此,本文以武汉市为例,引入地理探测器,分析不同因素和其交互作用对人口集聚的影响作用,为城市规划提供决策参考。结果表明:1)相比工作时段,休息时段人口相对分散,但中心空心化趋势不明显;2)从各因素的影响作用来看,第三产业企业密度、路网密度、房价、地铁站可达性等对人口集聚影响最大;3)人口集聚受到因子间交互作用
倾斜摄影测量是新型测绘的数据采集方法之一,它能够获取常规航空摄影无法得到的地物立面纹理信息和几何信息,但是在像控点布设和空中三角测量(简称"空三")方面还没有制定相应的技术规范,不利于这一新技术的推广应用。本文以大疆210无人机搭载五拼倾斜相机进行倾斜摄影测量工程为例,设计了4种像控点布设方案,分别进行空三加密处理,同时取部分像控地标作为检查点,分析了不同像控点布设方案对空三精度的影响,提出了在周
全球导航卫星系统具有独立的时间参考系统,即GNSS时间,并溯源至UTC时间。GNSS时间精度参数不仅影响定位和授时的精度,也影响不同GNSS系统之间时间偏差的计算和预报,进而对GNSS系统的互操作性产生影响。本文对GNSS时间标度的产生和维持进行了分析,并通过分析给出了其精度估计结果。
近年来,随着倾斜摄影技术以及建模软件的不断成熟,实景三维建模技术取得了迅速的发展与广泛应用。但受到航摄死角、地物遮挡以及影像错误匹配等影响,通过倾斜摄影技术构建的实景模型存在局部几何结构粗糙、空洞等现象。本文主要研究基于航空摄影测量和贴近摄影测量技术采集影像,并利用实景三维建模技术将无人机影像处理得到的点云与贴近地面采集的地面影像处理后得到的点云融合进行精细化实景建模。并以山西省大同市煤炭地质公园
以川滇地区1999—2007年、2009—2013年和2014—2016年三期GPS速度场为约束,利用块体整体旋转与线性应变模型(RELSM)和剖面法分析了红河断裂带现今不同时期运动特征。结果表明,红河断裂带整体运动特征是右旋走滑,北段和中段兼具拉张运动的特征,南段是挤压运动的特征。RELSM模型表明,2009—2013年红河断裂带北段走滑速率拉张速率分别增大到4.5±0.9 mm/a、5.2±0