基于LDA模型特征选择的在线医疗社区文本分类及用户聚类研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:jinr0op4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(Latent Dirichlet Allocation)模型进行特征提取来构建低维度文本表示向量,采用二元分类法将用户文本分为不同的社会支持类型。最后,基于分类结果使用K-means算法进行用户聚类来识别用户角色。相比传统的特征提取方法,利用LDA进行特征提取能显著地降低数据维度,优化分类模型,提高分类准确率和分类效率。结果表明,本文提出的中文用户文本挖掘流程在文本分类与用户聚类中效果显著。
其他文献
<正>我是一个农村党支部书记,在农村工作中风风雨雨十几年,感想很多。近年来,退休党员在农村党员人数中占有很大比例,在管理中令人头痛。通过本人走访周边村支部和其他乡镇村
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探究酶联免疫吸附试验法(ELISA)应用于孕前TORCH三项病原体感染检测中的临床价值。方法将本院在2014年3月至2017年6月接收的孕检孕妇98例作为研究对象,所选孕妇均通过ELISA
由于液压冲击机械在各个行业中的迅速推广应用,为适应不同的作业条件,对其技术性能提出了更高的要求。合理匹配液压冲击机械的输出参数——冲击能(E)和频率(f),可适应不同的作业条件
热声驱动低温制冷机是一种完全无运动部件的新型热力机械,具有高度的可靠性。它以热源作为驱动,在电能缺乏热能丰富的地方具有广泛的应用前景。近年来热声驱动低温制冷机的研
目的:针对颈椎病患者展开临床护理研究,了解护理干预对患者颈椎病疼痛感等方面的优化影响。旨在进一步指导我院临床护理工作,提升护理有效性。方法选取我院在2013年1月~2014
目的:探讨经皮椎体成形术对骨质疏松性胸腰椎骨折患者生物力学的影响。方法:选取9具冻存新鲜尸体的胸腰段脊柱开展研究,并应用随机数字表法分为观察组、对照1组和对照2组,每
只研究良渚遗址群的纯学术问题,不与当今现实有机结合,那么良渚遗址群的利用前景决非美妙。