科技资源跨媒体信息的分布式检索查询研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:chengl1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中的科技信息日益丰富,不同学科之间相互融合又催生新的研究方向,科研工作者通过发表论文等形式分享自己的研究成果,他们也会通过检索等方式了解其他人的研究进展,对于科研工作者来说,了解学科动态和热点研究主题有利于深入探索不同的研究方向。科技资源不仅包括论文、项目和资讯等文本信息,还包括图像等不同媒体的数据,这些数据中包含着科技资源独特的属性,关键词、学科和研究主题之间存在着关联关系,而传统的方法并不能很好地针对这些特性做检索查询。本文基于神经网络、聚类算法、分布式搜索引擎等技术,通过BERT模型、聚类算法和卷积神经网络分别提取科技资源跨媒体信息中的文本特征和图像特征,根据关键词、学科和研究主题的映射发现学科交叉关系,对学科和研究主题的趋势做预测,将预测结果和研究主题影响力指数共同作为因子影响查询排序结果,实现了科技资源跨媒体信息分布式搜索系统。本文完成的工作可以分为以下四点:(1)针对科技资源跨媒体信息中各属性的特性,提出了基于科技资源学科特性的特征提取算法。结合Scrapy爬虫技术获得了科技资源跨媒体数据集,获得的数据总量超过十五万条,由于这些数据有着多源异构的特性,本文针对不同来源的数据进行了去重等预处理操作。在文本特征提取方面,基于BERT模型,通过编码器实现了文本向量化,对于科技资源图像,通过构建的十三个卷积层获得了图像特征,并进一步应用聚类算法获得了这些资源中的学科和研究主题。(2)提出了科技资源跨媒体信息关系发现和演进规律分析的方法。根据已经获得的科技资源特征,研究了学科和研究主题的关联关系,构建出科技资源交叉学科的整体体系。根据科技资源的时序特性,提出了针对科技资源的学科及研究主题演进预测算法,该算法引入了卷积层进行训练和学习,最终达到了预测学科下的研究主题的发展趋势的效果,该预测结果将作为检索查询阶段的重要因子影响系统最终的展示结果。(3)提出了结合科技资源跨媒体信息特征的基于学科关系及影响力的检索算法,通过定义针对科技资源的研究主题影响力指数对研究主题影响力进行量化表示,根据特征提取阶段和关系发现阶段获得的结果明确检索中学科和研究主题的关联关系,在对检索结果进行排序展示时,除了考虑学科交叉关系,加入影响力指数和趋势预测结果作为因子,最终得到能够有效表达科技资源学科发展情况的结果。基于Elasticsearch分布式搜索引擎,加入Redis缓存技术,提升系统在检索查询时的响应速度,另外,根据实际应用场景考虑用户的需求,结合可视化方法,细化系统使用逻辑,提供良好的交互,为用户展示清晰的结果。(4)设计并实现了科技资源跨媒体信息的分布式检索查询系统,针对不同的功能实现做出描述,并以可视化示意图进行展示。系统共分为科技资源中学科关系发现、科技资源跨媒体信息检索查询和科技资源中学科及研究主题演进规律分析三个功能模块,并通过测试验证了系统的性能,以及模块功能的正确性。本文实现了科技资源跨媒体信息的获取与数据预处理、科技资源跨媒体信息特征提取、科技资源跨媒体学科关系发现与演进规律分析、科技资源跨媒体信息检索查询与可视化,最终完成了科技资源跨媒体信息的分布式检索查询系统,可以实现交叉学科资源的检索查询,可视化展示学科关系和趋势,计算研究主题影响力,并且系统的交互良好,有一定的实用价值。
其他文献
技术发展带来了媒介传播领域的深刻变革,不同媒介之间的互动互联,形成了组织结构上、传播内容上、传播方式上与技术上的媒介融合趋势.在这一背景下,互动影视作为影视与游戏两种媒介的融合,成为高速发展的新兴产业.本文从互动影视的概念与特征入手,分析互动影视产业的现状及其所展现的媒介融合特征,并对互动影视未来发展道路提出建议.
期刊是信息传播的重要方式,期刊编辑的业务能力和水平,对期刊质量、甚至是相关领域内的信息传播,都会产生极大的影响,要想提高杂志社的办刊水平,提高杂志的内容质量,就需要想方设法的提高杂志社编辑的工作能力.本文根据现有研究资料,结合自身在杂志社编辑工作中的一些经验,针对杂志社编辑工作能力的提升路径进行了分析,认为编辑业务培训和继续教育是核心路径,在此基础上要重视和加强业余时间的专业练习和强化、做好作者的沟通交流等.通过研究,希望能对杂志设编辑工作能力的提升提供一些帮助和启示.
随着社会的发展,人们获取新闻的途径越来越多,因此人们便对新闻提出了更高的要求,为了可以更好的满足人们的需求,在融媒体的背景下,便对新闻采编工作提出了新的要求.在传统的获取新闻途径中,报纸是唯一的途径,但是随着科技的发展,各大社交平台也逐渐成为了人们获取信息的途径,当人们获取信息的途径多了之后,便对新闻的质量提出了更多的要求,所以为了新闻采编工作有一个更好的发展前景,同时也有一个更好的机遇,便对其提出了新的要求,使其工作的更加有意义.本文就新闻采编工作的特点以及新的要求展开论述,探究在融媒体时代下,如何更好
近年来随着信息技术的不断发展,新媒体传播技术也获得了升级和创新,进而加快了新闻传播方式和媒体传播格局的转变.国内众多传统媒体为了有效适应整个传播行业的变化,纷纷开始转型之路,逐步推动媒体融合.在当前媒体融合背景下广电媒体的融合不仅是实现自身高质量发展的必然要求,而且也是不断提高广电新闻舆论传播力、引领力、影响力以及公信力的重要举措.因此本文对电视新闻融媒体产品的具体生产策略进行详细阐述.
近年来,新媒体及信息化性技术的普及,为电视新闻记者的采访工作带来了难度.记者是新闻报道和舆论的引导者,电视新闻记者的职业素养和采访能力,对电视新闻有着直接的影响.鉴于此,在新媒体时代背景的影响下,本文首先对电视新闻记者在采访中面临的困难,以及记者采访工作的现存问题进行分析,其次,探究记者在采访时要遵循的原则,最后研究采访工作时所应用到的方法和技巧,旨在促进记者采访工作的顺利完成.
当前的环境下,新媒体发展迅速,使得公众的信息交流载体出现了本质的变化,且大有取代传统媒体演变为信息传播主体的趋势.而纸媒也面临着何去何从的发展挑战和质疑,但不可否认的是,无论新媒体优势如何明显,其也掩盖不了传统纸媒的原有优势,特别是其完善的人力资源队伍、信息深入报道以及公众心目中的权威性等优势,要想真正实现媒体行业的创新持久发展,必须寻求纸媒与新媒体“握手言和”的突破口,让两者有效融合,取长补短,互利共赢.本文主要就新媒体发展趋势下,其与纸媒的有机融合问题进行探讨,明确两者的融合对策,以实现新形势下媒体融
随着科学技术的不断发展和进步,数字信息逐渐的被人们所接收和认可,并且互联网新媒体正在逐渐替代传统媒体形式,在这种情况的影响下,对于从事记者行业的人来说,既是一种机会,也是一种挑战.因为其自身需要转变工作方式和手段,来迎合国家和社会的发展趋势和节奏,同样也需要学习全新的专业技术,从根源上提升自身的专业素养和综合能力,这样才能更加快速为人们提供信息和数据,让他们获取更加优质的服务,从而推动记者行业的发展和进步.
新媒体时代背景下改变了报纸记者的外部工作环境,这就意味着给报纸记者工作方式和工作内容均提出较高的要求.在此背景下报纸记者应转变为信息引领者、信息求证者和公共权利捍卫者.同时,在此背景下还要成为复合型人才,推动自身乃至报社的发展.
与其他行业不同,广电行业业态复杂,涉及众多环节,且拥有海量大数据信息,因此,合理应用大数据技术,按照“数据整合—数据分析—数据挖掘—指导决策”思路,使原本大规模的离散数据变得有价值、有规律,以为广电行业的蓬勃发展提供数据支持.基于此,文章结合笔者多方调研与既往广电行业工作经验,从大数据技术特征与系统架构入手,全面探讨了大数据技术在广电行业中的具体应用,以供借鉴参考.
如今的互联网时代充斥着海量信息,如何快速检索并获取所需信息成为了一项挑战。在信息服务应用中,问答系统是一种高级的信息检索系统,能够以自然语言形式回答用户提出的问题。为了提升信息服务的准确性,结构化的知识图谱被作为问答系统的底层支撑,为系统提供回答问题所需的知识,但是这又引出了知识如何表示的问题。传统的基于符号表示和语义解析的问答系统在实际使用过程中面临着计算效率低和数据稀疏性等问题,不利于问句理解