基于延迟决策和斜率的新词识别方法

来源 :四川大学学报(自然科学版) | 被引量 : 6次 | 上传用户:xulinsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用词典分词时会遇到未登录词的识别问题.本文提出一种新的中文新词识别方法,用于全文信息检索系统索引的建立.在索引切分过程中遇到无法切分字串时,暂存为未切分串,并生成统计信息.待未切分串达到一定数量时,再利用生成的统计信息结合斜率(加速度)的方法来切分暂存的未切分串.切分的结果可以进入索引,对于出现频率高的切分片段可以提取加入词典.
其他文献
当前小电流接地大量运用于我国的电网当中,可是由于被各种因素所影响,单相接地问题依旧会不断涌现,从而影响到设备、线路乃至电网的使用。通过对小电流接地系统信号特点的分析,探
【目的】研究1-甲基环丙烯(1-MCP)对不同采收期砀山酥梨黑皮病发病情况的影响。【方法】以砀山酥梨(Dangshansu pear)为试材,对不同采收期(采收期Ⅰ:果实未成熟,为当地大量采收期;采收
【目的】利用优质高分子量麦谷蛋白亚基对小麦进行遗传转化和品质改良。【方法】采用花粉管通道法,将小麦高分子量麦谷蛋白14亚基基因导入洛阳8716、陕354、陕893、小偃107和
该文在梳理休闲观光农业及农业产业化内涵的基础上,以新津县方兴镇"返乡农民工万亩创业园"为例,提出了现代休闲观光农业产业的经营模式及产业化路径,以期为休闲观光农业产业的
【目的】通过对奶牛MC1R基因核苷酸序列的分析和蛋白结构的预测,探讨奶牛红白花毛色形成的分子机制。【方法】采用PCRRFLP技术对奶牛MC1R基因进行分型,利用生物信息学方法对其
【目的】为保护和发展甘肃省现有森林,改善自然资源匮乏、生态环境脆弱的局面提供参考依据。【方法】利用甘肃林区1971-2003年气象要素、1988-2003年森林火灾及1990-2001年植
【目的】研究番茄红素β-环化酶(LYC-b)基因反义表达对番茄果实中番茄红素含量的影响,为番茄品质育种提供新方法。【方法】以番茄品种“TT11117A”和“灵光3号”为材料,构建了分
摘 要:土壤样品的采集对于土壤环境质量监测数据结果的准确性起着决定性的作用,土壤样品采集的质量保证和质量控制是科学、准确地获取有代表性、典型性的土壤样品的保障。该文从采样前的准备、样品采集以及样品保存与运输等方面论述了陕西省土壤例行监测样品采集的质量保证和质量控制。  关键词:土壤;样品采集;质量保证;质量控制  中图分类号 TS255.1 文献标识码 A 文章编号 1007-7731(2016)
摘 要:淮安红椒有春提早生产和秋季延后生产两种形式,淮安地区主要以秋季延后生产为主,一般6—7月播种育苗,11月中下旬至翌年3月中下旬采收。淮安红椒栽培若要保证高产高效,必须做到选择适宜品种、适期播种定植、精细的田间管理、活体保鲜处理得当、采收期合理等技术措施。该文着重从以上几个方面加以阐述,以供参考。  关键词:淮安红椒;周年生产;技术集成  中图分类号 S63 文献标识码 A 文章编号 100
【目的】制备环保低毒的木质-橡胶环保复合材料。【方法】采用Design—expert的响应曲面试验分析法分析异氰酸酯(PMDI)、脲醛胶(UF)及木刨花与橡胶颗粒质量比(W/R)对木质-橡胶复合材