【摘 要】
:
搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚类。传统搜索引擎聚类没有充分利用搜索引擎
【基金项目】
:
国家自然科学基金资助项目(60736046)
论文部分内容阅读
搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚类。传统搜索引擎聚类没有充分利用搜索引擎结果的自身特点,或者计算复杂度较高。本文提出了一种基于主题词匹配频数的搜索引擎聚类算法,该算法从高频词中筛选出主题词,根据主题词共现情况自动产生类别,其他结果依据满足与类别主题词表的匹配频数的文档数进行聚类。实验结果与STC和LINGO算法相比,搜索质量有所提高。
其他文献
拥塞控制是组成IPQos的重要部分,传统的拥塞控制算法主要是通过对本地的资源拥塞信息来进行拥塞状态的判定和丢弃决策,而这有可能会导致带宽浪费问题。通过对基于网络处理器的
如何设计出满足安全需求的安全协议是一项非常重要的课题,目前尚无有效的方法。Fail-Stop协议在遭遇干扰其正常运行的主动攻击时完全停止。本文提出了一种设计Fail-Stop协议
可能性聚类有两大缺陷:一致聚类中心问题和有效性指标失效问题。对于第一个问题,有人提出在目标函数中添加聚类中心排斥项,但这样会引入更多的参数。为此,本文提出了一种改进的可
公诉机关提出的起诉裁量建议,如不起诉决定,由于较少考虑其他诉讼主体的利益而往往不能被广泛接受。运用经济学的博弈理论来分析不起诉裁量行为中检察官、被害人与犯罪嫌疑人
通过一个简化的2-bit问题对多智能体社会进化算(MASEA)中的进化算子及其组合进行形式化描述,分析了MASEA的全局动力学形态。针对算法中的进化算子建立数学模型,通过分析模型中各
根据电影拍摄的"轴线规律",本文给出了一种简单的电影场景的定义方法,并根据该场景定义,提出了一种电影场景检测算法。算法首先使用改进像素点匹配二次差分法进行电影镜头的检测,然后根据自定义的镜头相似性判断原则进行镜头聚类得到电影场景边界。实验表明,该算法可以有效地检测出电影场景边界。
针对现行的软件工程人才培养模式,提出并实施了以合作企业真实项目进行实训的方式,推动软件工程教学改革,加强学生动手能力的培养,让学生将所学到的理论知识在实践中加以运用
本文实现了统一建模语言(UML)描述的模型与企业过程建模系统(EPMS)模型之间的转换。UML的特点是便于建模,主要用于对软件的描述,不能进行模拟执行和优化。EPMS对业务过程进行建模,用