LDA模型在话题追踪中的应用

来源 :计算机科学 | 被引量 : 0次 | 上传用户:lovetianbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对LDA模型的研究越来越深入,文本表示和挖掘能力进一步提高。"话题"是LDA模型中一个非常重要的概念,是特征集合的一个多项式概率分布。话题追踪是根据少数已知相关信息在未知报道流中追踪一个话题,找出与该话题相关的所有报道。把LDA模型用于话题追踪,目的有两个:(一)检验LDA话题对追踪话题的表示能力;(二)检验LDA模型在挖掘训练数据中的追踪话题时,LDA话题和追踪话题之间的关系。实验表明:相对于经典的向量空间模型和一元语言模型,以及专门针对追踪话题提出的事件模型,基于LDA模型的追踪性能更好,但由于粒度不同,LDA模型中的话题和追踪话题并没有直接的一一对应的关系,实现可定制话题的LDA模型是下一步工作的目标。
其他文献
兼并和收购(并购)是一种重要的资本运作模式.然而,并购案例的成功率很低.企业并购的筹备阶段、运营阶段或整合阶段,都伴随着各种金融风险.本文根据并购交易的过程将并购中产
热镀锌板表面钝化(铬酸盐钝化),主要是为了防止在使用过程中其表面被氧化.由于表面的钝化膜的存在,使得磷化工艺无法进行,从而影响涂装后涂层的附着力(铬酸盐钝化膜不如磷化
本文从以色列的农业概况入手,介绍了以色列的节水农业,农业与温室,农业法律,生态农业,种子研发体系,农业合作体系和农业技术推广体系以及外贸农业和人文农业方面的情况,并就
随着经济和工业的发展,环境问题日益凸显,近些年来气候变暖问题的始作俑者——CO2的排放更为引人注目。电厂燃烧化石燃料产生的CO2是温室气体的一个主要的集中排放源,也是治理CO
伴随着工农业的迅速发展和人类生活水平的提高,农药、化肥及合成洗涤剂的大量使用和污水排放总量的不断增加等等,污水中所含有的氮素已经逐步上升为主要的污染物。污水脱氮的
文章就铁路客车转向架节点座位置度超差问题做出分析,提出用位置度检测工装的方法来代替实物压套试组装验证,对机加工工序中节点座位置度进行质量过程管控,提前发现加工过程中出
<正>中风后抑郁症(post-stroke depression,PSD)是脑血管疾病常见的并发症,临床上以情感障碍为主要表现,发生率在25%~80%之间。主要表现为情绪低落,兴趣减少,悲观,失眠,烦躁,
会议
重金属汞对水体、土壤、人体、大气都会造成污染和危害。铁离子在人体中也存在着一个平衡,过高浓度的铁离子和过低浓度的铁离子都会影响人们的健康。所以选择一种适当的方法
目的探讨原发性肝癌经导管肝动脉化疗栓塞术(TACE)后白蛋白水平的变化以及应用的价值。方法将白蛋白在28~35 g/L中晚期肝癌80例随机分为2组,治疗组在TACE术后应用白蛋白;对照组
军事电子信息系统是一种典型的大规模复杂系统,如何获取这种复杂系统的需求仍然是一个难题。提出了一种新的能力需求分析方法。该方法从领域概念化入手,构造了C4ISR能力概念