基于信息增益与相似度的专利关键词抽取算法评价模型

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:shy1201107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]针对目前专利关键词抽取算法评价中主要采用抽取的关键词与专家人工标注关键词进行匹配存在的问题,提出一种基于信息增益与相似度的专利关键词抽取算法评价模型.[方法/过程]提出的评价模型从内部和外部两个层面评估专利关键词抽取算法的准确性.其中,内部评价模型度量待评价算法抽取的每个关键词的信息增益,以评估被抽取的关键词的新颖性与创造性;外部评价模型使用待评价算法抽取的关键词集表示专利,计算相关专利的相似度,衡量算法抽取的关键词描述专利主题的有效性.[结果/结论]通过评价模型有效性验证实验与评价模型应用实证研究,结果表明提出的基于信息增益与相似度的评价模型具有可行性与有效性.
其他文献
承继共犯的本质在于犯意、行为、过程的延续性、接力性.其所要解决的核心问题有两个,即后行为人与先行为人是否构成同一罪名的共犯以及后行为人是否对包括先行为及其结果在内的全部事实承担责任.肯定说主张“罪名同一、全部责任”,否定说主张“罪名各异、个别责任”,两说分别解决承继共犯问题的一个方面.限定肯定说试图走中间路线,但难言成功.相比之下,我国司法实践中承继共犯的处理既不是肯定说也不是否定说,而是采取“罪名同一、主从责任”的独特路径,不仅具有理论依据,而且能够解决具体问题.
[目的/意义]重点科研团队是高校科技创新的重要主体,高校图书馆为重点团队开展知识产权信息服务既能深化本馆用户服务,也能辅助团队科研创新、成果转化,促进高校产学研协同发展.[方法/过程]以H大学某重点团队知识产权信息服务为案例,介绍图书馆服务基础、图书馆服务的情报分析过程,依据重点团队服务需求与特点,提出基于巴斯德象限理论的高校图书馆知识产权信息服务策略.[结果/结论]面向重点团队开展知识产权信息服务,高校图书馆可从管理层、用户层、服务层3方面制定基于巴斯德象限理论的服务策略,以促进团队科研成果转化,使得团
田野调查最初在人类学中得到运用,此后被引入社会学、政治学、教育学等人文社会科学的广泛领域,成为开展经验研究的一种重要方法.随着时代的发展和思想政治教育实践与理论研究的发展,思想政治教育学所面向的“田野”也不断延展,需要我们在思想政治教育的田野上开展更加扎实有效的调查研究.思想政治教育学需要进入这片田野,深入这片田野,扎根这片田野,从田野调查中汲取理论与方法的养分,对人的思想品德发展、社会的意识形态发展、思想政治教育实践发展、思想政治教育的客观影响,展开全面的、广泛的、细致的研究,丰富思想政治教育的经验研究
[目的/意义]文献遗产政策对实践具有引导性与约束力,是推动实践良性发展的必备要素.对标国际文献遗产政策,及时对我国文献遗产工作做出正向调整至关重要.[方法/过程]主要采用政策文本分析方法,具体步骤为:首先引入UNESCO文化遗产工作方法论框架——“三步执行战略”,通过审视UNESCO具有关键节点意义的文化遗产政策证明其合理性,并通过历史回顾梳理其内在的价值转向.其次,以此为参照,从“文献遗产的确认、保存、获取”3大方面对UNESCO文献遗产政策进行分析.最后,结合实际情况,得出对我国文献遗产工作的启示.[
[目的/意义]比较分析我国《个人信息保护法》中的个人信息权利与欧盟《一般数据保护条例》(GDPR)中的个人数据权利,为健全我国个人信息权利体系和加强我国个人信息保护提供参考.[方法/过程]采用比较分析法与文本分析法,从权利主体、权利客体及权利内容3部分比较分析我国个人信息权利与欧盟个人数据权利的异同,阐述我国个人信息权利有待进一步完善的问题.[结果/结论]我国个人信息权利与欧盟个人数据权利可分为显性个人权利、隐性个人权利两种类型,涉及15种具体权利.我国6种显性个人信息权利与8种隐性个人信息权利在一定程度
阅读人rn何 琳rn南京农业大学信息管理学院教授rn书 名:连接:社交媒体批评史rn作 者:[荷]何塞·范·迪克(著);晏青,陈光凤(译)rn出版社:中国人民大学出版社rn出版年:2021年rn社交媒体的蓬勃发展,给情报学研究带了新的场景、新的数据和新的研究问题.然而社交媒体研究是个十分复杂的多角度问题,信息科学家致力于探索社交媒体的数据集以及分析算法;社会学家侧重研究用户行为模式以及信息秩序的影响;人文学者关注内容和文化形式;经济学家致力于商业模式研究;法律学者关注数据隐私保护等.他们都从不同的视角对社
期刊
[目的/意义]科研协同的效应取决于信息完整、正确、有效地流动,而在信息流动过程中不可避免地存在信息故意失真行为,即通过伪造、隐瞒和逃避等来操纵信息等行为.研究科研协同的信息操纵行为及其影响因素有助于科研机构掌握信息操纵行为的特征,制定信息治理策略,提升协同效应.[方法/过程]基于扎根理论,对111位科研人员进行深度访谈,构建科研协同中的信息操纵行为影响因素概念模型.[结果/结论]科研协同中的信息操纵行为具有利己性、欺骗性、策略性、隐蔽性等特征.可以通过培养科研人员的奉献精神、提升科研人员的信息素养、弘扬协
[目的/意义]以知乎为例研究中文社交媒体中用户对学术论文的使用行为规律,为扩充Altmetrics数据源提供参考.[研究设计/方法]从知乎的问答和专栏文章采集论文使用行为信息,将论文使用行为分为使用场景、使用形式和使用语境三方面,构建编码体系,通过内容分析、统计分析等方法揭示用户行为特点.[结论/发现]中文社交媒体上用户对学术论文的使用行为具有多样性、复杂性和一定的规律性,这些行为可以反映论文的价值所在,增加论文的关注度;作为典型的中文社交媒体,知乎可以成为评价论文社会影响力的新Altmetrics数据源
[目的/意义]构建多源文献元数据融合模型,有助于提升文献元数据整体质量,促进资源发现系统中的元数据管理与利用,优化用户资源发现服务体验.针对笔者此前提出的文献元数据判重策略进行优化,从经验为主向自动化转变,在保障判重和融合效果的前提下,提升整个过程的自动化水平.[方法/过程]针对不同类型文献的元数据项不一样、同一文献不同来源的元数据项不一样均会使得判重方法有所区别的情况,提出一种自动化的基于决策树的多源文献元数据融合模型,将判重问题转化为分类问题,根据特征相似度选择特征并构造决策树,在此基础上实施元数据判
1引言rn信息行为研究是一个涉及面广、研究对象多元并随着信息技术进步而不断演化的社会科学研究领域,它面向所有与信息资源、信息渠道有关的主动或被动的人类行为或活动[1].信息行为研究的历史悠久,最早可以追溯到1849年递交到英国国会的一份关于图书馆的效用及读者阅读行为的报告[2],因为其研究的重要价值而成为学者们热衷的研究主题.自1948年的英国皇家科学信息会议(Royal Society Scientific Information Conference)召开以来,信息行为研究逐渐成为图书情报学核心研究领
期刊