基于概率和句法分析的中文句子修剪

来源 :第五届全国青年计算语言学研讨会(YWCL 2010) | 被引量 : 0次 | 上传用户:qianwenlong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种中文句子修剪方法。引入噪音通道模型,经过改进,提出了更适合句子修剪任务的Bi—NC模型。 引入无导的方法,解决了中文中缺乏原句-压缩句对齐语料的瓶颈问题。提出了一种自底向上的层级优化算法,避免在优化过程中删除最优修剪句,解决了长句处理时间过长的问题。实验结果表明,本文提出的中文句了修剪方法获得了较好的效果。
其他文献
针对传统查询推荐方法中存在的相关性度量问题和冗余性问题,本文中提出了一种新的基于流行排序的查询推荐方法。该方法利用查询数据内在的全局流行结构来获得查询之间的相关性
地球气温曾在5500万年前极速攀升,不仅导致海平面升高、海洋酸度增大,还使得一些物种永久消亡,这种全球性变暖现象就是著名的“古新世-始新世极热事件”.不过,这种现象在科学
本文针对题录信息中的人名、地址、机构名和公司名的不同特征,分别设计了不同的翻译方法,并依靠词典和翻译规则,实现了大部分内容的翻译。对于人名翻译,本文设计了拼音转换、假名
在文本分类领域,常用的特征选择方法(如文档频率)是基于概率统计信息的。本文从一个全新的角度,即基于认知情境的语义框架的角度进行特征选择,这种方法可以较准确地抓住文本类别
连词使用范围报广,越来越受到语言学研究的重视,同时也是语言教学中的重要一环。已有的连词研究多是定性的对连词范围、功能、用法的研究和探讨。本文在国家语言资源监测与研究
会议
目前网页标题的抽取方法大多利用HTML结构和标签特征生成特定规则进行抽取,但是这些方法只考虑到了HTML的统计特点,没有考虑标题与正文信息之间的关系。本文提出一种基于相似度
受到西方语言语法体系的影响,现代汉语中能够翻译成英语对应的从句的结构越来越多。但是因为汉语传统的语法结构与西方语言语法体系有着很大的不同,利用西方语言的句法分析方法
会议
进入2010年,巴西CVRD和澳洲BHP、Rio甚至包括FMG们被全球范围内粗钢产量的快速增长所鼓舞,在铁矿石刚性需求渐趋强烈的趋势下,大幅提高铁矿石价格成为巨头们的主要努力方向.
期刊
在大句的范围内小句的组织结构会呈现某些特定的模式,即大句范式。而范式的运用存在着语种间的有无或常用罕用之别,需要在翻译时予以变换。迭句与花园幽径句都是汉语的常用大句
缩略语是几乎所有的语言中都存在的语言现象,它把必要的信息压缩到在接触的一瞬间就能立刻了解的程度,使语言的使用和表达更加的便捷和快速。由于缩略语本身具有的简洁、快速等