基于条件随机场与Web数据的缩略语预测

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sukeyjuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缩略语在自然语言中被广泛使用。因其是新词的重要来源之一,成为了自然语言处理领域的一大问题。该文以汉语为对象,研究了从完整形式预测缩略语形式的方法。首先,使用条件随机场模型对完整形式进行序列标注,生成缩略语候选集合。再利用搜索引擎获取网络数据,并通过不同策略利用网络数据对各候选依次评估,结合各项评估分数进行重排序,选择最终的缩略语结果。实验结果表明,增加Web信息之后,缩略语预测的准确率可以提高约五个百分点。
其他文献
社区问答系统已经积累了大量的以层次类别结构进行组织的问题答案对.为了能够重用这些非常宝贵的历史问题答案对资源,设计出一个非常有效的问题检索模型至关重要.在该文中,我
从病鸡肝分离到一株病毒,经电镜检查、理化特性分析、核酸电泳和中和试验等证明它为禽呼肠孤病毒(ARV)。该病毒只在鸡胚肝细胞(CELi)上产生细胞病变(CPE),在鸡胚成纤维细胞(CEF)和V_(ero)细胞上不增殖,它对热
1引言  高中的数学知识是基础数学,是数学大厦的根基,其中排列组合是独立的内容,也是重要的内容。在生产实践中,排列组合的知识也经常应用,比如,工作安排力的分工、选配等实际问题,用排列组合来解决将会得到更好的处理结果。  2排列组合的基本概念和计算公式  排列的定义:有n个不同元素,从中取出m个,按照顺序排成一列,叫做排列。  组合的定义:有n个不同元素,从中取出m个,组成一组,叫做组合。  排列数