基于LDA的问答网站话题抽取算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:lijingmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了帮助用户在使用问答网站时准确地描述所提问题的话题,对社会化问答网站问题及话题进行了建模,发现问题的潜在语义关系,提出一种基于潜在狄利克雷分布LDA(Latent Dirichlet Allocation)的话题抽取算法。该算法通过挖掘问题与问题之间的潜在语义信息,找到潜在语义相类似的问题,在语义层面上抽取出话题集合,找到最符合的话题列表。在真实网站中的数据进行试验证实,应用该算法可以有效扩大话题抽取的准确率和召回率。
其他文献
晋绰公执政时期,有个叫解狐的大夫,是名将解扬的儿子。他为人耿直倔强,公私分明,晋国有个叫赵简子的大夫和他十分要好。