面向冗余度控制的中文多文档自动文摘

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:SOHOCJ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点.相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性.因此如何控制信息冗余是多文档自动文摘的一个关键所在.本文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过抽取关键句子及计算文本单元之间的相似度,通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的.实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统.
其他文献
针对性提出在煤层倾角≥55°、煤层厚度≥2.8 m条件下采面开切眼采用煤矿用液压挖掘机机械化掘进工艺,采用挖掘机气锤破煤、挖斗装煤转煤,煤炭进入下煤通道,实现开切眼由传统
因使用一种独特的分画面驱动法,使电致发光(EL)显示器的刷新率提高一倍达到120Hz。系统设计者现在能够选择2个不同的发展方向,降低显示器功耗而不使亮度受到任何损失,或者提
I am a scientist(科学家)wearing a white coat,doing an experiment about the cancer(癌症)treatments(治疗)in the lab(实验室).Through years of researching(研究),I f
通过对城市化进程中农村环境现状的调查与分析,揭示了城市化进程中农村环境污染的污染源及重要危害,提出有效解决农村环境问题的途径与方法:全面防控企业污染,优先保护水源地环
会议
结合国内外矿井工作面探水技术和设备的发展情况,分析了直流电法、瞬变电磁等现阶段常用探水技术在原理、应用等方面的技术难点和局限性.介绍了矿井双模网络并行电法探水技术
针对煤层赋存条件差、地质构造变化、钻孔轨迹偏移等原因导致本煤层钻孔在部分区域不能完全覆盖回采工作面,造成工作面回采至该空白带区域时瓦斯偏高,甚至断电停产.对比分析
有一些摄影作品能让我们为美所折服,有一些摄影作品能让我们为奇所惊叹……。看到他的作品,我的心轻轻一颤,引人深思。穿越图片,回到当时,所有的作品都似乎传递着很多信息,历
我台25频道使用的30KW速调管发射机是美国COMARK公司的产品。北京广播器材厂通过对其消化吸收,研制开发了自己的776系列速调管发射机。因此两者具有许多相同和相似之处。工
和林格尔是一个以蒙古族为主体,汉族为多数的少数民族聚居地。悠久的历史,多彩的民俗,使得这里的婚俗具有独特的人文特质。在众多的和林格尔婚俗中,媒妁撮合是最为普及的一种
抽取式摘要是从正文中按照一定策略抽取重要句子组成摘要.本文提出了一种句子抽取方法.基本思想是将句子的抽取看作序列标注问题,采用条件随机场模型对句子进行二类标注,根据