面向领域的指标挖掘方法研究与系统实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:liu554802016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界创新驱动的发展,科技技术受到前所未有的关注。尤其近年来,随着专利申请数量的增多,互联网平台涌现大量的非结构化专利文本数据。这些数据中蕴含很多科技技术发展关键指标,如何从专利文本数据中有效地挖掘指标,为专利对比评估和企业技术评估提供参考依据是本文研究的重点。因此,本文提出面向领域的指标挖掘方法研究与系统实现,具体工作如下:通过调研国内外专利文本数据研究和文本指标词挖掘研究现状,结合其他学者对专利文本内容挖掘和文本指标词挖掘研究属性特点,总结了面向领域专利文本指标词挖掘的特征选取形式,利用文本挖掘的基础特征以及专利文本指标词的位置信息和周围修饰词特点,构建以N-gram、词性、动词+名词、动词+形容词+名词、动词+副词+名词、动词+形容词+副词+名词、动词+形容词+数量词+名词等七个属性特征作为专利文本指标词挖掘研究特征,结合现有的依存句法分析技术和Word2Vector进行特征工程处理。面向领域指标挖掘方法模型选择。在基于BP神经网络的指标挖掘方法模型中,利用BP神经网络的非线性映射能力和自适应能力进行指标词预测,根据经验公式计算隐含层神经元个数范围,训练模型寻找MSE最小时神经元个数,调整不同的学习率进行模型优化。在基于贝叶斯神经网络模型的指标挖掘方法研究中,利用贝叶斯神经网络模型的良好的鲁棒性和网络权重是随机分布不易陷入过拟合的优势进行指标词预测,根据经验进行网络层数确定,利用公式得出隐含层神经元个数范围,寻找MSE最小时隐含层神经元个数优化模型。接下来将两个模型的实验结果进行对比分析,结果证明本文提出的研究方法有效。最后将本文提出的研究方法应用到实践,利用Java语言搭建面向领域的指标挖掘系统,辅助专利科研人员对专利技术和企业技术评估提供依据。
其他文献
摘要前列腺MRI广泛应用于指导前列腺癌病人的组织活检、病情监测和肿瘤分期。前列腺成像报告和数据系统(PI-RADS)有助于提供一种标准化的概率性方法来识别有
期刊
近年来,随着互联网的发展,传统旅游业迎来全新变革。越来越多旅游景区开始应用“互联网+旅游”发展模式。目前,旅游领域中亟待解决的问题是游客如何快速且准确地获取信息。以往,游客主要通过传统搜索引擎获取信息,但其无法满足快而准确的需求。而与传统搜索引擎不同,问答系统直接返回答案,能够满足游客的实际需求。目前,问答系统的数据来源主要包括问答对数据、文档数据、以及结构化数据等。与前两个相比,基于结构化数据的
摘要在钆塞酸增强MRI上非动脉期高强化(APHE)的肝胆期(HBP)低信号结节可能提示肝细胞癌(HCC)或非恶性肝硬化相关结节。目的评价钆塞酸增强MRI上无APHE
期刊
近年来,伴随着社交媒体的快速普及以及国家对于优秀传统文化艺术创新的大力支持和资金投入,博物馆作为一个承载、传播优秀传统文化的重要场所,开始越来越多的出现在我们年轻人的生活和视野之中,然而笔者在研究过程中发现当前我国博物馆传播存在创意思维狭窄,内容产品同质化,产品研发成本高,协同创作能力弱等问题,同时博物馆之间的发展还很不平衡,因此博物馆的传播与壮大成为了一个迫在眉睫的问题。故宫博物院作为国家博物馆
命名实体识别是自然语言处理领域的重要研究内容之一,是多项自然语言处理任务的基础工作。本文针对蒙古文旅游领域命名实体识别中标注语料库缺乏、实体识别准确率低等问题进行了研究,构建了一个蒙古文旅游领域命名实体识别标注语料库,该语料库标注了84607个实体,包括人名、景点名等5大类、18小类。在此基础上,使用深度学习技术,对面向旅游领域的蒙古文命名实体识别展开研究,具体内容如下:针对多义词中向量表示不充分
在自反性现代化阶段,一个特色鲜明、数量可观的群体——小镇青年,逐渐进入研究者的视线成为研究热点。他们生活在城乡二元关系的夹缝之中,“悬浮”是其关键词,“脱域”是其生存常态,该群体的身份认同问题日益凸显。而快手App的兴起与发展,为小镇青年提供了自我赋权的发声场域与身份认同的新路径。在城镇化纵深化发展中,对于该群体“嵌入”城市提供了新的范式与思考。本文在已有研究基础上,主要采用质化研究中的深度访谈法
学者的兴趣标签不仅仅能体现学者本身的学术研究内容与方向,也体现学者对某一个或多个科研领域的关注程度。现有的学者兴趣标签挖掘方法大多基于学者的论文中包含的文本信息和网络结构信息进行分类,但是在对文本信息的利用上,现有的方法大多采用概率主题模型生成文本属性,得到的文本信息属性粒度较粗;在对网络结构信息的利用上,现有的方法则大多将原本隐含在论文信息中的异构信息网络解构成多个同质网络进行节点嵌入的获取,丢
随着新媒体在政务报道中的角色越来越重要,作者以走在全国前列的广东“决战决胜脱贫攻坚”为切入点,深入剖析以广东省委机关报、网、端为核心的《南方日报》新媒体矩阵在这次宣传报道中,采用了怎样的传播策略,又呈现出怎样的传播特征。首先,从《南方日报》的转型之路入手,厘清《南方日报》新媒体矩阵的形成过程及基本特征;其次,厘析新媒体矩阵各平台的文本、内容和叙述结构的特点,以《南方日报》新媒体矩阵对决战决胜脱贫攻
作为我国北方重要的生态安全屏障,内蒙古自治区近年来的生态环境状况受到媒体的广泛关注。本文选取2012年至2020年《人民日报》《内蒙古日报》以及《中国环境报》中对内蒙古生态环境的报道作为研究范围和对象,运用内容分析、文本分析及个案分析法,研究三大主流报纸在内蒙古环境新闻传播中角色建构与功能发挥。本文主要研究以下问题,一是内蒙古环境新闻传播中媒介应然角色建构的逻辑标准及机理要素;二是媒介实然角色的总
在县级融媒体中心建设要实现全国覆盖这一背景下,不同地区的县级融媒体中心发挥地域性优势,积极响应打通基层社会治理的“最后一公里”的要求,实现资源下沉,提供精细化、精准化服务的目标。县级融媒体中心参与基层社会治理处于探索初级阶段,各地的县级融媒体中心都做出不同的反应,采取不同的做法。鄂尔多斯市东胜区融媒体中心在县级融媒体建设过程中如何发挥自身作用,如何利用好此次时机改善本地区基层社会治理?实现了哪些有