Web聚类技术及其在搜索引擎中的应用

来源 :西华大学 | 被引量 : 0次 | 上传用户:lyh041899999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文给出了基于MyCluster算法的聚类搜索引擎框架及聚类结果评价体系。实现聚类搜索引擎的过程中将涉及多种编程语言(例如HTML、Javascript、CGI和C++等)和数学软件MatLab,并实现了C++在脱离MatLab环境情况下对MatLab生成的动态链接库的直接调用。我们的聚类结果评价体系通过类标签的可读性、类内容的相关性、类内容覆盖率和类重叠度等指标,来综合评价一个算法质量的好坏。通过对比实验,我们发现MyCluster在类标签可读性和类内容相关性方面有很大地优势,但在类内容覆盖率方面有所欠缺,希望未来将能有所改进,并在增量聚类等方面作进一步的研究。
其他文献
  本文介绍了保证服务质量的QoS路由(QualityofServiceRouting)是网络中解决QoS问题的一项关键技术。QoS路由的主要目标是为接入的业务选择满足服务质量要求的传输路径,同时
多媒体技术和数字图书馆的发展和应用,使基于内容的检索技术成为图象处理和计算机视觉的前沿问题。基于内容的检索技术就是直接根据描述媒体对象内容的各种特征进行检索,它的
计算机虚拟三维场景绘制作为虚拟现实系统中的重要组成部分,是当前计算机图形学方面的热门领域之一。它可以为人们提供非常直观自然的交互界面,因此已经在计算机辅助设计、数
多媒体会议克服了传统的通信工具不具备的面对面的沟通效果,又节省了时间和费用,提高了开会效率,所以得到了广泛的应用。目前的多媒体会议系统无论是基于电路交换网的H.320
科学计算可视化是20世纪80年代发展起来的一门新学科,它运用计算机图形学和图像处理技术,将计算过程中及计算结果的数据转化为图形图像的形式在屏幕上显示并进行交互处理。在
数据库中知识发现(Knowledge Discovery in Databases,简称KDD)是近年来人工智能、数据库应用等领域的研究热点。目前,KDD的研究涵盖了多个领域的多种知识发现方法,已经能够发现
UML是面向对象开发中一种可视化建模语言,已经成为事实上的面向对象建模标准。虽然表达丰富,但UML不是形式化的建模语言,其图形化的符号经常缺乏精确的语义,这使得对UML进行形式
本文对曲面造型中散乱数据插值曲面问题进行了研究。构造散乱空间数据插值曲面技术在CAD、计算机图形学、气象和勘探等各类科学研究和工程设计中有广泛的应用。 由于工程
JFFS2是为使用闪速存储设备的嵌入式系统专门设计的一种日志式文件系统。作为一种基于日志结构的文件系统,JFFS2采用了新的存储方式,可支持耗损平衡,并具有断电保护功能,因而
本课题研究专家系统在森林防火中的应用。仔细分析和研究了森林火灾的扑救方法和方式,认真总结了国内外的森林防火技术,利用专家系统、WEB技术和COM技术,设计了一个火灾发生