一种基于词关联图的专题发现方法研究

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:zzy101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络新闻文本的专题发现(Topic Detection)旨在从大规模网络新闻文本集合中自动提取属于相关于同一主题的新闻文本.由于专题的主题、类型和规模并未预先定义,并且不具备任何先验知识可供参考,从而,现有研究往往利用聚类方法实现专题的自动发现.然而,聚类算法对内容相近的新闻专题难以有效区分.针对上述问题,提出了一种基于“社交圈子”结构的文本归并方法,深入特定聚类内部,根据社交圈的差异,进行二次划分.将文本内容和社交网络共同作为判定专题内外关联程度的特征信息,形成联合的判定模型.实验结果显示,在采用TF-IDF作为特征的聚类结果中使用“社交圈子”进行进一步聚类划分,可提高精度迭3个百分点,此外,聚类结果的熵降低了0.258,显示了较高的确定性.
其他文献
主要针对中文网页语料研究人物关系抽取,提出一种融合最近距离和人名窗口信息的人物关系抽取方法.首先利用远程监督的方法构建人物关系库,提取关系候选语料,通过打分函数过滤
本文理顺了班主任的工作范畴,提出了班主任队伍建设的不足,即:高校对班主任队伍建设不够重视;高校班主任缺乏明确的职责,工作热情不够;班主任队伍的整体水平不高;缺乏有效的班主任工
摘要:在进行旧城改造活动之中,如何合理、完善地进行房地产拆迁补偿评估,在推进城市建设的同时,安抚好居民。文中就房地产拆迁补偿评估中存在的问题展开了分析,并就拆迁机构及拆迁人员应当如何合理评估拆迁补偿,解决拆迁补偿评估中存在的问题提出了相应的解决措施,具有一定的参考价值。  关键词:房地产;拆迁补偿;评估;问题;措施  当前,许多新闻报道关于房地产拆迁补偿事件,经常出现由于拆迁补偿评估价得不到一致意
目的:通过对早产儿早期经口微量喂养联合腹部按摩与常规喂养方法的效果进行比较,为防治早产儿喂养不耐受提供一种可靠的治疗方案.方法:选取70例早产儿作为研究对象,将其中35
目的 探索四川省某医学院学生约会暴力及相关因素的状况,为预防和改善青少年期和成年早期学生心理和行为问题提供参考依据.方法 采用自制的约会暴力调查问卷、症状自评量表(S
以国家电网公司为代表的电网企业信息化建设快速推进,审计人员在应对信息技术挑战和人少任务重的矛盾中,赣州电网企业着力开展远程审计,分析开展远程审计的主要影响因素,探讨
近年来,随着不动产交易数量的增加和房产税试点范围的逐步扩大,不动产评估业务量显著增加。评估准则在保障不动产评估业务质量方面发挥着重要的作用。论文将我国不动产评估准则与国际评估准则、美国评估准则中的不动产评估规范进行对比分析,主要从准则的结构、具体资产定义、评估方法三个方面考察不同准则之间的差异和共同点,以期进一步推动我国不动产评估准则的发展与完善。  一、房地产评估准则结构比较  中国资产评估协会
根据隔热套管寄生管光纤测井工艺特点,在井位选择、钻完井、管柱设计、完井井口装置设计等方面进行优化改进研究,形成隔热套管寄生光纤测试钻完井技术,现场应用2口井,成功率100%,
目的:探析心电图下壁导联钩型R波与婴幼儿继发孔型房间隔缺损程度的关系.方法:选择本院于2008年3月至2017年3月间收治的1.6万例儿科心电图为研究主体.其中119例被诊断为婴幼
小学语文教育是一个人接受人文教育的起点,同时也是实施素质教育的基础,学生在这一时期内所获得的知识,对其今后的学习和发展都有着重要影响。因此,在小学语文教学中,我们往