基于多因子算法的自动分类研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:fdsth5x1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]从实用角度出发,研制领域适用性广、人力投入少的分类标引方法,支撑海量信息资源分类管理与学科领域地图揭示.[方法]基于文献中代表主题概念的术语、概念等关键词和分类号的兼容关系,研究设计多因子加权分类算法,在此基础上提出全流程自动分类标引方案.[结果]以权威的多领域标注语料库和标准集为数据来源进行分类标引实验,单类号文献标引准确率84.1%,召回率79.8%,F值81.9%;双类号文献标引准确率83.4%,召回率78.8%,F值81.0%0[局限]学科分类标引的准确率及完整性依赖高质量标注语料库,且在多类号资源的标引上有待提升.[结论]本文提出的多因子算法自动分类标引具有较高的可操作性和实践应用价值.
其他文献
【目的】探索共享平台中不同主体的信息线索及其线索一致性对用户购买决策的影响机制。【方法】以线索一致性理论为基础,从房客文本线索(UGC)和房东图片线索(MGC)角度构建模型,利用爬虫技术在共享住宿平台网站上获取相应房源数据,研究信息线索一致性对消费者购买决策的影响。【结果】UGC的文本线索和MGC的暖色调图片显著正向影响用户购买决策,UGC与MGC的信息线索一致性程度对用户购买决策具有显著正向影响
近日,发表在Proceedings of the National Academy of Sciences上的一篇文章中,来自英国和爱尔兰的研究人员使用数据科学和网络理论共同解开了《权利的游戏》所改编自的小说
期刊