基于模板知识的带噪音半结构文本数据自动分词方法

来源 :微型机与应用 | 被引量 : 0次 | 上传用户:cw545400
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机噪音会引起半结构化数据结构和语义的变化,从而造成半结构化数据提取或向结构化自动转换障碍,为此本文在分析噪声对半结构化文本数据带来的影响基础下,提出了一种基于语法模板结构知识的自动化分词处理思路和方法 ,可以提高带噪音的半结构化文本数据自动分词准确性,可为类似问题提供参考。
其他文献
本文主要就国内目前关于硬覆盖对城市行道树土壤呼吸的影响方面的研究进行了简要综述,并就如何改善硬覆盖下土壤通气不良、行道树生长势弱的情况提出了建议。
以STM32F103VCT6单片机为控制核心,实现了一个可产生两路幅度、频率、占空比、相位差皆可调的矩形波或正弦波的双相信号发生器。系统由带有TFT显示屏、键盘输入模块的STM32系