后缀树聚类相关论文
[目的/意义]一个好的主题搜索引擎能够更好地满足专业领域用户的信息需求。[方法/过程]在爬取阶段采用锚文本正则表达式匹配进行主......
随着计算机网络技术在全球范围内的迅速发展与普及,网络信息资源日趋丰富且内容复杂多样,其中既有大量进步、健康的信息,也不乏反......
模体发现问题,即寻找转录因子结合位点(TFBS),是生物信息学上研究的热门问题之一。由于模体蕴含着丰富的生命遗传特征信息,所以探究基......
随着互联网用户量的激增,使得网络中数据量飞速累积且数据格式也随之增多,搜索引擎成为了处于大数据背景下的网络用户获取所需信息......
讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实......
提出一种基于后缀树的文本聚类算法以实现中文文本的多主题聚类。先介绍基于后缀树的英文多主题聚类的主要流程。再分析中、英文语......
为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史......
经过几十年的发展,Internet已经成为世界上最大的资源库,其绝大部分信息都是以Web文本的形式存在。为了充分利用这些资源、使用户......
利用标准的分类测试集合进行聚类质量的量化评价,选择了k—Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实......
今天,互联网已经成为一个大众化和交互式的信息发布媒介。Web作为一个巨大的、开放的、异构的和动态的信息容器,产生和容纳了巨大规......
随着Web的不断发展和数据量的增加,Web用户越来越依靠搜索引擎来检索信息。搜索引擎用户的行为分析表明不仅需要对结果进行排序,也......
地区官方微博中包含了大量相关当地的事件信息,聚合地区官方微博数据可以发掘当地的重要事件;结合地区微博数据地区别称、不同层级......
目前互联网领域主要的搜索引擎服务商如Google、百度、Yahoo等,为用户提供的都是横向的海量信息搜索。这些通用搜索引擎在满足信息......