基于模糊集的web文本最大支撑树聚类算法

来源 :湖南省第二届图书情报学研究生论坛 | 被引量 : 0次 | 上传用户:ren584521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  当今信息社会,Internet上的信息资源存储量令人难以想象,用户从搜索引擎上得到的信息杂乱无章。本文根据html网页的中title、“keywords”、“description”标签所含的特征词出现的位置,计算各web文本内容之间的相关度,并对web文档进行模糊聚类。该算法改善了时间和空间的复杂度,减少了文本处理的维度,提高了聚类的速度和精度,从而提高了用户对信息资源的获取的方便性。
其他文献
  知识产权和数字鸿沟问题的矛盾是信息社会发展的必然产物。一方面,信息社会的发展加速了人们信息接触和信息拥有的权利分化,导致了诸多社会问题。数字鸿沟越来越引起了社会
煤炭资源在人们的现实生活中具有十分广泛的作用,然而煤矿开采由于受到地质条件的影响,通常难度较大,同时存在着较为严重的安全问题,阻碍了煤矿开采工作的有效开展.而掘进支
一春天来了,农安县哈拉海镇人民法院助理审判员翟树全望着窗外的迎春花,心情格外地好。这时,一位大娘挎着篮子推门而进,没等翟树全说什么,她便放下手中的篮子,拉着他的手一口
  在知识经济时代,知识作为最重要的战略资源已成为企业竞争成败的关键因素和保持持续竞争优势的最可靠的资源,而知识管理则是促进组织竞争力永续发展的核心要素。文章从知识
渤海油田大部分为电泵生产作业管柱,在检泵作业过程中,电泵生产管柱配套的电缆及压力计管线,伴随电泵落井后,影响电泵打捞,并且一直存在着绳类落物缠绕堆积造成常规内外钩无
  文章在描述农村弱势群体文化贫困的具体表现的基础上,探讨出建立面向农村弱势群体的图书馆服务体系的意义所在。最后提出了图书馆服务体系的建设策略:以政府为主导的服务体
随着我国社会经济的飞速发展以及科学技术的不断创新,煤炭行业也获得了快速发展.但是,在现阶段煤炭开采过程中还存在着很多显而易见的问题,其在很大程度上影响和限制了煤炭行
从吴江市松陵城区户外广告现状分析研究入手,结合城市户外广告规划设置,探讨了户外广告设置规划区的分类及分布标准,提出了建立城市户外广告分类设置技术标准。 Starting wi
  图书馆对书的整个管理过程中,需要涉及到图书的书标、条形码和防盗感应磁条这三个重要的概念。它们主要用于图书的分类上架和查找利用,使每一本图书拥有一个计算机能够识别
  社区服务的质量离不开公众参与,文章建立了社区服务中公众参与影响公众满意的概念模型,并进行相关量表设计。运用结构方程模型及LISREL参数估计进行模型验证,结果表明公众参