中文Web检索中聚类算法的改进

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:libraspace
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对基于混合相似度的HTFC算法进行改进,要做的预处理是:建立向量空间模型,计算文档和链接的混合相似度.算法过程是:首先随机选取√kn个文档进行层次聚类,直到剩k个聚簇为止;对这k个聚簇不断迭代直到集合元素不再变化为止;然后表示出每类;最后通过用户对结果的反馈使得新生成的簇继续迭代,最终满足用户需求.算法第1步采用的是改进的k-means算法,可提高运行效率.反馈机制对原有模型进一步修正,从而提高精度.
其他文献
目的探讨患者青霉素过敏性不良反应的临床用药情况及不良反应特点。方法选取本院51例青霉素临床用药发生过敏性不良反应的患者作为研究对象,对患者采取抢救和治疗措施,分析患