基于关联规则的科技文献分类研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:aji_y
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。 According to the classification of scientific and technical documents oriented to the structural characteristics, the scientific and technical documents are divided into different types through the classification of association rules: review type, theoretical type and applied type. Firstly, the word segmentation of scientific literature data is preprocessed. Secondly, PredictiveApriori association algorithm is used to mine the frequent itemsets of the category features and to construct the classifier of scientific and technical document classification. Then the classification technology documents are classified and matched to determine their classification. Finally, The experiment evaluated the classification performance and proved the effectiveness of the method by comparison.
其他文献
本文通过对拳击这项运动的简要介绍,让更多人了解这项运动,从而进一步提高人们对拳击文化以及它的社会价值的认识,最终是吸引更多的人参与这项运动,推动拳击运动的发展.目前,
武术散打是中华民族的宝贵遗产之一,经过数千年的传承与进步,在国际武术界中也能够占有一席之地,吸引了很多高校学生的注意力,所以,现在我国很多高校开设了武术散打课程,不仅
本文在引言部分首先提出了研究分析分类法在网络环境下的应用和发展这一问题的背景、必要性和重要性.分别从基本方法、一般方法和专业方法三个层面上介绍了在写作本篇论文的
本文以中国高等院校的体育文化建设为研究对象,通过探讨和分析高校体育文化的内涵和现状,管窥高校体育文化建设的发展趋势,在此基础上提出了广东省高等院校体育文化建设的相
科技信息网站作为传播科技信息的重要途径,其好坏直接影响到信息服务的效率和用户获取信息的质量,因此,建立一套科学的评估体系对于科技信息网站的发展和信息用户查阅科技信
论文系统地探讨了机动车污染危害和防治机制,深入分析了国外大城市机动车污染状况和防治经验,全面研究和总结了北京市机动车污染状况和防治措施.在此基础上找出了北京防治机
自日本学者在二十世纪60年代提出信息社会概念以来,世界各地的学者从不同角度描绘了信息社会的轮廓,今天我们生活的社会亦正步向学者们所说的信息社会.1956年美国的白领工人
传统的专家识别系统大多采用一组带权重的关键词来表征专家的专长,然而这种基于关键词的专长描述不足以概括专家的研究主题。提出基于领域本体概念的专长表示方法,通过构建相
内容管理在电子政务、数字图书馆和电子商务的建设中都起着重要作用.内容管理包括Web内容管理、企业内容管理、学习内容管理和媒体内容管理等,Web内容管理是当前的研究热点之
知识挖掘一直是知识管理中的热点研究领域。知识挖掘作为知识开发的重要工具,为知识的创新提供了更多方法和技术,不仅可以提高知识管理的效率,而且可以通过促进知识创新实现知识