基于Trie树和有限状态自动机的中文地址解析模型

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:rogiangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,无论是在研究或者是商业领域中,中文地址解析都没有一个成熟的模型结果。要素识别是地址解析的关键技术,传统的地址要素识别是基于特征词和字典匹配的方法,难以解决地址命名的多样性问题。利用自然语言处理技术,根据Trie树模型对行政区域寻址的方法和有限状态自动机模型对非规范地址的要素提取方法,本文提出T-FA模型对地址进行分级划分。其中,采用隐马尔可夫模型的切词方法和最长公共子序列算法,可以解决地址要素识别的模糊化搜索。T-FA模型具有良好的泛化能力,在批量处理地址时具有很好的通用效果,能比较有效地解决中文地
其他文献
文章就中职计算机应用专业"项目一贯制"人才培养模式的构建、实施及保障机制进行了探索,包括"项目一贯制"人才培养模式人才培养的过程,构建项目引领的课程体系,构建行动导向的教
文章先阐述了实现高校学生管理工作法制化的重要意义,再分析了当前高校学生管理工作法制化进程中存在问题原因,最后提出提升法治意识,转变管理思想及模式;健全法制化管理机制
CERNET2的建成推进了IPv4向IPv6过渡的进程。介绍了基于网关的IPv6组播过渡技术,给出了设计模型和实现方案。
本文对大西客运专线2标混凝土工程作了简单介绍,根据大西客专2标混凝土工程缺陷的特点制定了相应的处理技术文件,针对大西客专2标混凝土工程缺陷处理要求,进行了环氧树脂灌浆试
碑刻民俗志在当下民俗志写作中处于重要但尚未被重视的现状,梳理民俗学史学就会发现碑刻民俗志属于民俗志书写范式的重要类型之一。从民俗学研究的视角出发,陕西省岐山县周公
土壤成份分析实验的改进潜江王场镇施场小学孙廷金(433100)《自然》第二册(怎样认识物体(三)一土壤》一课,按教材中介绍的方法进行实验,实验现象不太明显,效果不好,如果在选用土壤时,土壤里含
文章首先分析了我国现阶段土地利用总体规划与城市总体规划的关系,认为这两项规划是国土规划中互有侧重、互为弥补、不可缺少的专项规划;其次,分析了这两项规划的主要矛盾,认
为了探索适合移民区学校人文校园创建的有效途径,文章结合生态移民区学校的实际情况,提出了四条有效途径,包括优化校园育人环境,凸显学校人文精神;强化师德师风建设,提升教师
文章阐述了高校现代教育中心的传统职能定位,分析了高校现代教育中心的发展现状,指出了高校现代教育中心职能定位的创新,包括增加现代教育技术培训职能,丰富现代公共教学资源