一种结合Bigram语义扩充的事件摘要方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:tony_yang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在事件检测过程中,事件摘要是十分重要的一个步骤.一个可读性较强的事件摘要能帮助人更快的理解事件,而一个可读性较差的事件摘要则会误导人的理解.传统的文本摘要主要倾向于找到一条最具代表性的句子,但我们认为在某些时候,用户只需要通过阅读几个关键词的组合就能明白事件的主要内容.因此,在本文中我们提出了一种基于Bigram关键词语义扩充的事件摘要方法,因为IDF在短文本中表现较好,所以首先根据IDF值从事件短文本集合中提取若干个关键词,然后根据事件短文本集合对关键词之间的顺序进行整理,最后引入了Bigram语言模型对提取出来的关键词进行语义扩展.利用实际生活中的短文本集合进行实验,结果表明我们的方法在召回率与用户可读性上优于现有的关键词摘要方法.
其他文献
传统权重公式TFIDF忽略了词语在集合中的分布比例,针对TFIDF的这个缺点,把信息增益公式引入文本集合中并提出IF*IDF*IG,取得了较好的效果。在分析中发现单纯把信息增益引入文
本文详细介绍了遗传算法(GA)及其数学基础,遗传算法与传统优化方法的区别,总结了遗传算法的特点.同时给出了几种GA的改进方法和应用GA的要点.
本研究初步研制了急诊病人满意度量表,采用现场调查的方式,有效回收率为96 8%,应答率为96 2%,内部一致性α系数较高(0 7099~0 9217),各条目与其所属因素有较强的相关性(除B15
本文用Toksoz等人提出的频谱振幅法对砂、泥岩样品的纵、横波速度(vP、vS)及其品质因子(QP、QS)进行了实验室测试,得到以下结论:对于干燥岩石,衰减与频率无关,且纵、横波速度
数字鸿沟是在全球数字化进程中,不同国家、地区、行业、职业、家庭、人群之间由于对信息、网络技术发展、应用程度的不同以及创新能力的差别造成的"信息落差"、"知识分隔"和"
在韩国文学史上,朴婉绪是一位举足轻重的作家,她的作品被称作”携刻着韩国现代小说年轮的巨木”。她的作品描写了韩国不同历史时期,最具代表性的女性生活状态及意识状态,通过对50
<正>在西方,为了保证经典剧作不走样,对经典剧作如莎士比亚剧作的演出,一些艺术家遵循一个不成文的规则"只删不加"。安振吉排演的《大雷雨》并不受此约束,他借鉴的是我国戏曲
社会转型期 ,以个人伦理的支配性为基本特征的传统伦理形式 ,无法为市场经济提供有效的道德支持 ,新的伦理形式———制度伦理———成为经济条件下伦理发展的必然。制度伦理
首先介绍了公路桥梁施工监理的重要性,随后分析了公路桥梁施工问题的主要体现,重点探讨了公路桥梁施工监理的主要措施,包括桥梁路面材料的选择、桥梁桥涵工程质量的监理、强