数据挖掘在科技论文分析中的应用研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:zxc473138
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先详细介绍了数据挖掘的概念、研究现状、分类、应用以及数据挖掘与传统情报分析中统计分析方法的异同,然后有重点地论述了关联规则挖掘问题,并详细讨论了关联规则的挖掘模式和经典Apriori算法.最后以中国科技信息研究所信息分析中心的科技论文引文数据库为例,对数据挖掘技术进行了实际应用的研究,既构建了数据挖掘关联分析平台,实现了针对期刊之间引用关系的挖掘工作,并提出利用时间序列概念和记录加权思想拓展关联规则挖掘算法,对比了挖掘结果,对挖掘结果做了进一步的应用分析.该文对数据挖掘技术及其在情报分析中的应用进行了较深入的研究,将数据挖掘的关联分析与时序加权思想相结合应用于情报分析工作并取得了初步的成功,是一种有意义的尝试.
其他文献
信息资源是是用户服务的基础和重要内容,信息资源的整合共享是信息资源开发利用的关键,也是图书情报机构竞争优势的重要体现,其共享水平决定图书情报机构的服务能力与发展程度。
气象科学数据是国家基础信息资源的重要组成部分,在国民经济建设、社会进步、科学研究和国防安全中发挥着巨大的作用.2001年底,气象科学数据开始提供面向社会的公益性共享服
科普作为提高国民素质的必要手段,已经成为世界主要国家的一项长期战略性任务.面对知识经济的发展机遇和挑战,中国政府近年来推出一系列举措大力发展科普事业.然而,从整体上
随着我国学者对灾害信息管理和防灾减灾主题的深入研究,我国防灾减灾信息管理研究取得了一定的研究成果和进步,对防灾减灾工作的开展实际提供了理论和决策支持。然而由于我国防
近年来,知识管理已经成为管理学家和企业管理者们最热衷的话题.竞争情报研究作为我国企业进军全球市场的触角和智囊,也就理所当然的将知识管理作为贯穿竞争情报研究活动的主
背景:网络的普及使得信息获取变得更加方便,但是信息的含金量并未同步增长.对于科研用户来说,他们要花更多的时间和精力来寻找最新最全面的专业信息.如何对于非结构化的网络
该论文主要讨论了实体—关系数据库建模方法的局限性以及如何利用面向对象的思想进行改进,并且以黑龙江大学的教务管理的实际情况为背景,对基于校园网的教务管理信息系统进行
在信息时代,人们对信息检索的要求越来越高。随着信息技术的迅猛发展,检索手段也不断发展。但是无论使用何种检索手段还是采用何种检索方法,高质量的被检索的数据才是高质量检索
随着网络的飞速发展,如何既能够利用局域网技术简单、廉价的组网特点,同时又能够对用户或设备访问网络的合法性提供认证,即如何对宽带用户接入进行有效的管理,日益成为一个重要的
利用福建省三城市2005年国民体质监测资料,对福建省福州、厦门、三明三城市8 850名成年人(20~69岁)中超重肥胖者分布特点进行研究.结果表明:超重肥胖率存在很大的人群差异,表