主题模型LDA的多文档自动文摘

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:guogangw1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型.实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于LDA的多文档自动文摘方法在通用型多文档摘要测试集DUC2002上的评测数据进行比较,结果表明提出的基于LDA的多文档自动文摘方法在ROUGE的各个评测标准上均优于SumBasic方法,与其他基于LDA模型的文摘相比也具有优势.
其他文献
<正> 一 1990年,华纳通信公司和时代公司达成141亿美元的合并协议,通过这一事件,影视节目的主要生产商与世界上最大的一家出版商走向联合;而就历史进程的意义来说,它在相当程
着重从分布式电源并网对电能质量影响评估方法上进行了分析。总结了分布式电源并网对电能质量的不利影响,构建了风电并网模型和光伏发电模型,进行了含分布式电源配电网的电能
目的:观察温针灸治疗慢性非细菌性前列腺炎的临床疗效。方法:将125例患者随机分为温针灸组(42例)、针刺组(41例)、西药组(42例)。温针灸组予针刺配合温针灸治疗,①针刺肾俞、
<正> 各省、自治区、直辖市、计划单列市及新疆生产建设兵团商务主管部门,本部各直属单位,各商会、协会、学会:为加快推进我国商务领域信用体系建设,促进商务领域信用信息的
高等教育政策工具是实现高等教育政策目标的有效手段与途径。通过对我国1994—2014年间的159份政策文本进行文本计量与内容分析,了解到我国高等教育政策数量与高等教育大众化
班主任是学校学生管理工作的直接实施者,必须具备应有的工作艺术,才能够营造出一个良好的班级学习氛围,从而促进学生各个方面的健康发展,塑造学生完美的人格,培养学生健康的
《中华人民共和国出境入境管理法》根据形势的需要,从改进服务方面入手,完善和创新了关于24小时免办签证临时入境政策,扩大了过境免签适用范围。近阶段,上海出入境边防检查总
目的:探讨Gwe口服液对慢性迁延型肝炎患者血清补体溶解免疫复合物能力(CMSC)的影响。方法:以健康献血员为对照,采用改良的天野氏比色法,测定18例慢性迁延型肝炎患者服用Gwe前后1个月左右的CMSC。结果
<正>脑卒中多见于老年人,常存在不同程度的听力、感觉、运动及理解等能力下降,在临床护理中极易发生坠床、跌倒、进食误吸、呛咳、误服和漏服药物、走失等意外[1]。因此,脑卒
《防震减灾法》是国家公共安全的重要组成部分,随着经济的发展,社会的进步,人们对防震减灾工作日益关注。在传统科普宣传之外,如何利用大量地震监测台站开展防震减灾科普宣传