面向聚类主题的文本特征描述

来源 :情报学报 | 被引量 : 0次 | 上传用户:wangctm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种面向聚类主题的文本特征表示方法,即以聚类的主题概念来刻画文本的特征向量,将文本描述提升至语义层次。首先,通过聚类,形成一组以向量形式表达的隐含主题概念,再将基于词条空间的文本特征向量投影至这组主题概念,以隐含的主题概念来描述文本。实验分析表明,建立在概念空间之上的文本向量实质上是文本矢量与主题概念的关联度,能够突出表现文本内容的主题特征,更好地反映文本的语义内容,从而有效提高模型在文本检索与分类等领域的应用性能。而基于聚类形成的概念空间的维数由于可主观调整,又能有效地约减概念空间的维数,提高模
其他文献
高维、稀疏的用户.项目评分矩阵对基于项目的协同过滤推荐算法造成严峻的可扩展性问题。传统的解决方法是离线计算项目相似性并保存在系统中以供算法调用,但是不能充分利用最新
目的:分析HLA-Ⅰ类血清学分型误定规律,研究HLA-A,B位点基因分型方法,提高移植配型的准确性.方法:应用聚合酶链反应-序列特异性引物(PCR-SSP)技术,检测180例骨髓资料库中已用
日前,上海西站的南北通道、南广场已开通运行。开放前夕,“上海西站绿色低碳交通枢纽建设关键技术研究与集成示范”课题通过市科委验收,标志着全国领先的绿色低碳交通枢纽建成,预
查询结果合并是分布式信息检索中的一个重要步骤,其合并方法的选择直接影响检索结果的质量。本文首先对两种查询结果合并算法,即经典的CORI算法与新近提出的回归分析与选择下载
中国商飞结合当前行业内外生态技术发展前沿,积极探索实施“绿色商飞”行动计划,在产品全生命周期中贯彻“绿色发展”理念,以应对环境挑战,最终实现环境友好。中国商飞大力推动技
近年来许多中等学校升格为专科院校,我校也于2003年4月由原广东省梅州市卫生学校升格为嘉应学院医学院.并于同年9月份招收普通高考的大专护生,大专护生的入校对中专护生冲击
随着网络技术的快速发展,社交网站为广大用户提供了一种全新的交流和信息分享的平台,深受网友的欢迎。本文探讨了社交网站的交互模式,以测试来自传统物理世界的成本、互惠性、三
本文基于竞争情报领域研究生教育培养视角,从学科体系、学科在国内外的发展、社会对学科的人才需求、独立设置二级学科的必要性和可行性、设置二级学科后的发展前景5个方面,论
根据市政府与区政府签署了《打赢蓝天保卫战目标责任书(2018—2020年)》,青浦区将各街镇、青工园、西虹桥的任务分解至三年,2018年完成20%、2019年完成50%,剩余的在2020年10月1日之
从Egghe-Rousseau模型和Glanzel-Schubert模型出发,推演出h指数与总被引次数C之间的幂函数关系模型(即h-C幂律关系模型),此模型与之前的实证结果相符。模型中幂指数最大值为0.5