基于专利数据的技术趋势预测算法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:sslplq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
技术趋势预测对于企业、政府等决策机构进行资源分配有着重要意义。但是,目前的技术趋势预测需要长时间持续投入大量人力物力资源。本文旨在提出一种基于专利数据的技术趋势预测算法为技术趋势预测提供参考并节省其中的部分人力物力资源投入,设计并实现原型系统以验证本文提出的技术趋势预测算法在实际生产环境中的可行性。本文首先将技术趋势预测问题转化为时间序列预测问题。技术趋势预测算法即为针对专利数据的时间序列预测算法。目前现有的时间序列预测算法通常将数据集中的多个时间序列嵌入为一个高维时间序列进行训练和预测,这导致模型参数过多,并且当新的时间序列出现时,输入维数变化,模型需要重新训练。同时,本文所涉及的专利数据时间序列的序列数量和长度均小于常见的时间序列预测算法所研究的数据集,这导致含有过多参数的神经网络难以训练。并且,由于新技术不断出现,数据集中序列的数量随时可能增加,因此模型需要支持增量训练。另外,通常的时间序列预测研究关注在某个时间点的预测误差而不常关注对于未来整体趋势的预测,而本文除预测误差外更关注对于整体趋势的预测。其他研究所提出的模型与评估模型的指标在本文中并不适用。因此,本文提出了一种新的模型以完成本课题的要求。本文提出的模型从多个序列中提取一组共同的特征并在预测过程中一次生成对于未来一段时间的全部预测结果以解决本课题的问题。首先,利用卷积神经网络从多个序列中提取特征,以减少模型所需要的参数。之后,通过循环神经网络将卷积神经网络提取出的特征进行编码,得到一个中间表达。通过解码中间表达,模型可以生成未来一段时间内的全部预测结果。由于网络规模与数据集中的序列数量无关,因此本课题提出的模型支持增量训练。在训练过程中,由于中间表达的存在,在不同时间点的预测结果相互关联,网络参数的调整会影响多个时间点的预测结果,从而实现了对于发展趋势的学习。在测试与验证模型的过程中,本文不仅如其他序列预测研究一样采用了衡量数值误差的指标,同时还采用了衡量趋势相关性的指标以衡量本课题提出的模型对于趋势预测的效果。实验验证结果表明,本文提出的模型在专利数据集上对于数值预测以及趋势预测的表现均优于其他模型。同时,本文选择了其他一些由多个短序列构成的数据集以验证本课题提出的模型,在这些数据集上,本文提出的模型也在数值预测以及趋势预测上优于其他模型。从而通过实验验证了本文提出的模型具有一定的普适性。最后,本文设计并实现了一套技术趋势预测原型系统。该系统主要包括检索模块、算法模块和管理模块。该系统向用户提供了专利基本数据等多种分析数据以方便用户进行技术趋势分析,其中包括了本系统特有的技术趋势预测数据。经过测试,本系统预测效果良好,性能达标,可以在生产环境中使用,验证了本文所提出的算法在生产环境中的可行性。
其他文献
近年来,细菌靶向治疗已成为肿瘤生物治疗的一大研究热点,天然的或者是基因修饰的非致病菌成为了潜在的抗肿瘤制剂。兼性厌氧菌E.coli Nissle1917是一类安全性较高的益生菌,对
深海网箱因其具有容积大、抗风浪性强、自动化程度高等特点,是海洋设施养殖的重要战略方向。现有刚性网箱在加工装配后结构固定,难以自适应调节养殖区域、体积庞大难以运输,阻碍其在深海养殖的推广应用。针对深海网箱发展现状,本文将折展机构引入深海网箱设计,提出一种新型嵌套折展子母式网箱,通过折展调节网箱体积,子母式网箱结构实现多样化生态养殖,为深海网箱设计与研究提供了新思路。本文主要研究内容如下:(1)针对现
国外最新的学习理念和教育研究成果对于我国教育领域具有重要的借鉴意义,因此教育类成果英汉翻译的重要性也日益凸显。笔者选取了教育类研究报告Good Practice Report:Blended Learning(前半部分)作为翻译实践文本,进行了翻译实践活动,并针对翻译过程中遇到的问题进行分析、归纳和总结,形成翻译实践报告。笔者首先对原文文本特点进行了分析,确定该文本属于研究报告类文本,其用词较为严
水稻在世界粮食生产上具有重要地位,水稻的高产、稳产关系着人民的生计与社会的稳定。抽穗期决定水稻的区域适应性,同时也影响水稻的产量,是水稻品种选育需要考虑的重要因素之一。选用抽穗期适宜的品种可以促使水稻充分利用其种植区域的温光资源,以获得更高的产量,同时能够避免低温霜冻带来产量与品质的下降。挖掘和克隆水稻抽穗期相关基因,有助于探明其抽穗期调控机制,对水稻育种过程中抽穗期改良具有重要意义。水稻抽穗期受
E·M·福斯特是20世纪最优秀的英国作家之一,他的创作不仅是英国中产阶级的社会风俗画,同时也包含有大量的异国描写。他从大英帝国出走四方,而后回望,展示了一个20世纪自由主
分别以2,4-二苯基-4-甲基-1-戊烯(αMSD)和正十二烷基硫醇(NDDM)作为分子量调节剂,以甲基丙烯酸甲酯(MMA)和丙烯酸丁酯(BA)为主要单体,通过乳液聚合得到了丙烯酸酯乳液,探索了环保无
小微企业是经济社会发展的重要力量,在拉动经济增长、促进就业增加、激发创新活力等方面发挥着重要作用。但地方小微企业在发展过程中,由于自身结构不完善、财务管理不规范、抵抗风险能力弱等因素带来诸多发展难题,其中突出难题就是小微企业融资难。由于融资难导致很多小微企业资金链断裂,痛失发展机遇,从而影响地方经济发展。小微企业融资难题的解决,地方政府支持行为发挥主导作用。本文以小微企业融资支持的相关理论和国内外
尾矿坝作为一种特殊的水工建筑物,是关乎国计民生的重要公益性基础设施,其稳定性方面的研究一直是重中之重。随着计算机技术的高速发展,数值计算方法逐渐成为尾矿坝稳定性分析的主流,其中以有限元法为主的数值计算方法更是得到了越来越广泛的应用。而在进行尾矿坝静动力稳定性的有限元计算分析时,如何建立完整、准确、直观的有限元计算模型一直是数值模拟分析的重要研究方向。由此,本文通过集成化方法最优组合CATIA、HY
金融与实体经济之间的关系一直以来都备受争议,近年来,随着我国经济金融化程度的加深,金融对宏观经济运行产生了深刻的影响。经济金融化既表现为宏观层面的经济货币化率,又体现为微观层面的金融部门资产和盈利规模,以及非金融部门金融投资比重和金融收益比重。最近十多年来,中国经济金融化趋势日益加快,非金融企业金融投资比重大幅上升。以A股非金融类上市公司投资理财产品为例,据wind数据库显示,2014年购买理财产
近几十年来,熟悉度的影响因素是语言学研究领域的热点议题之一。熟悉度的感知可对人们的行为产生重要影响。词汇熟悉度作为一个重要的心理语言学影响因素,可对词汇认知和语言