一种基于相似度分析的主题提取和发现算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:ee320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
试图从另一个角度来考察主题提取算法HITS,即提出一种基于相似度的链接分析模型来观察主题提取的过程.通过给出一种一般化的相似度定义,提出了一种仅使用链接分析来改善主题提取的质量的主题提取算法.同时,还将主题发现的功能也结合到了算法的框架中.通过该功能,用户可以搜索到次流行的主题.实验结果显示了这一新算法的两个优点:不必使用内容分析即能改善主题提取的质量以及能够进一步发现在查询结果中显现出来的不同主题.
其他文献
学习力是反映一个人是否会学知识的能力.大学教师通过微积分的课堂教学活动可以帮助大学生尽早完善学习力,可采取的做法有:训练学生的"第一反应";注重定理、公式的教学;抓住
随着Internet的发展,应用的数据存储量与其增长速度都相当高,同时数据具有结构化特点,当前的(分布式)文件系统与数据库系统都无法较好地满足这一类需求.提出了一种网络附属对
以往的定性空间或时空推理工作多数面向单一时空方面,这不符合实际应用需要.提出了集成拓扑、尺寸和时间3方面信息的定性表示和推理技术,并应用到时空GIS中.给出了面向GIS的拓扑、尺寸和时间的表示方法,并研究了它们之间的依赖性.提出了集成这3方面信息的约束满足问题求解算法TriRSAT.在时空GIS中,把定性时空表示用于约束关系库,把TriRSAT算法用于时空数据一致性检查和时空查询.应用结果显示,该
把网络流量的有效测量问题抽象为求给定图G=(V,E)的最小弱顶点覆盖集的问题.给出了一个求最小弱顶点覆盖集的近似算法,并证明了该算法具有比界2(lnd+1),其中d是图G中顶点的最
以常微分方程组的演化建模问题为主要研究对象,设计了分布式异步并行演化算法,并以128台PIII 500微机通过10Mbps的以太网互联而成的机群系统作为模拟实验环境进行了大规模的
通过接种污泥硫细菌混合菌液,研究了S粉投加量与污泥含固率之比(SA/TS)对城市污泥中重金属生物淋滤效果的影响.结果表明,增大SA/TS值能显著缩短淋滤时间,提高淋滤效果.当SA/TS为2.5,经过8