基于强化学习的药品专利文本分析方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:opengl100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,在医疗体制改革政策的影响下,医药行业得到了迅猛发展,药品市场的需求不断地增长。制药企业作为国内医药行业的重要组成部分更是迎来了发展机遇。但有关数据表明,近几年制药企业的发展陷入了困局,其原因在于研制新药时所消耗的时间与成本过大。药品专利是制药研究人员获取信息的主要渠道之一,但药品专利篇幅长且信息量大,这导致制药企业的研究人员提取所需信息的时间成本过高。此外,在新药开发任务中,通过遵循某些给定的规则,根据化学分子性质,进而生成新的化合物更是重中之重。但在药厂中,研制新药通常需要通过做大量实验或者根据专家的经验改变化合物的化学性质,这样过于依赖人工经验,导致制药成本高、精度低,且对专家经验有较高的要求。因此,如何有效地控制药品专利分析的时间成本以及在已有研究成果的基础上进行改进的实验成本对制药企业研制新药、提高企业经济效益具有重要意义。针对这样的问题,本文提出了一种基于分层强化学习的有向分子设计模型,该模型引入分层强化学习的思想-Option框架对复杂的状态空间进行分层,能够有效优化化合物的化学性质。在动作Option模块中,本文设计了基于Q-learning方法的学习准则,通过不断更新动作值函数,选取动作Option集合(增加、删除、替换操作)中的最优动作,在遵循SMILES编码的规则下,克服了基于文本的深度强化学习方法出现SMILES语法错误的问题。在状态Option模块中,提出基于三步时间差分算法的化合物的更新策略,通过对未来三个时间步学习后的期望来更新当前化合物,进而提高模型的运行效率。考虑到改变分子主框架结构会对分子产生影响的问题,本文设计了一种基于水溶解度和结构相似性的模型奖励函数,从而引导模型产生所需要的物理或生物特性的结构。为了便于研究人员进行专利的查询和分析,基于本文所提出的算法并结合制药企业的实际需求,前端采用React脚手架、后端采用基于MyBatis的Spring Boot框架、数据库采用MySQL技术,开发了一套药品专利分析系统软件。系统采用B/S架构,具有用户登录、基础信息查询、结果精炼、SMILES主结构展示、分子性质优化五大模块的相关介绍及实现。本文所开发的系统应用还是实验仿真阶段,采用本文开发的系统进行分析,不仅可以快速查询药品专利信息而且能够优化药品专利中分子的化学性质,进而缩短药品研发周期。
其他文献
行人检测和行人重识别是计算机视觉领域极具挑战性的研究课题,是智能监控系统和智慧城市构建中的重要环节,以其重要的理论意义和使用价值受到学术界和工程界的广泛关注和研究
随着大数据的推动和算力的提高,卷积神经网络(CNN)在人脸识别,对象检测,追踪和图像分割等方向获得了巨大成功。为了提高模型的表现,学术界近几年设计出的网络结构更加深,计算
近十年来,伴随着航天和卫星传感技术的跨越式发展以及国家高分重大专项工程的启动实施,高分辨率遥感影像数据急剧增长,这在国土普查、路网设计、农作物估产和防灾减灾等领域
内容创业千帆竞发,自媒体平台春潮涌动。微信、微博、头条号、百家号等自媒体平台的受众范围已经远远超过传统媒体。生存在流量化中的自媒体,在给人们带来便利的同时也产生了海量的文本信息,自媒体文本中广告、电商、服务等因素也给用户获取信息增加了难度。如何帮助用户快速选择和甄别自媒体文本,高效率、高质量获得自己所需信息,把握同主题下自媒体动向已是迫切需要解决的问题。文本摘要是文章内容的真实反应,简洁且完整。自
混沌是复杂系统受到对初值敏感的确定性规律激励,而表现出明显无序和不规律的运动,普遍存在于自然、医学和金融等领域的复杂系统中。时间序列是按照时间的先后采样得到的一组
近年来,我国一直大力发展县级融媒体建设,倡导将原本的县级电视台等县级媒体部门,通过融媒体这种新型的媒体运营模式结合在一起,团结力量干大事,推动传统媒体与新媒体从相“
随着生物特征识别技术的进步,这些技术获得了广阔的应用前景。相对于其他身份识别技术而言,指静脉识别技术更加安全、高效和稳定。然而目前采集到的指静脉图像普遍存在质量不
面对呈爆炸式增长的肺结节计算机断层扫描(Computed Tomography,CT)图像,能够迅速准确的对肺结节CT图像做出诊断,变成了一份艰难的工作。利用已经确诊的肺癌数据库中病例数据
随着纺织行业的迅速发展,纺织面料的类型愈来愈多,尤其是新型纺织纤维材料的研发和混合纺纱面料的普遍化,织物的识别和检测逐渐成为一个研究的热点。在纺织工业中,织物的识别
数字集群通信系统(TETRA)作为专业的移动通信系统,其发展和应用标志着现代专业用集群通信发展的方向。监控调度中心是TETRA数字集群通信系统最重要的部分,对其进行二次开发,可以更好的支持监控调度员进行全方面的指挥,还可以为系统提供监控调度通信以及监听等功能。本课题主要研究TETRA数字集群通信系统中的监控调度中心的设计与实现,主要工作包括:首先分析了TETRA数字集群通信系统发展趋势,并对TET