基于深度学习的在线医疗社区知识图谱构建研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2012年谷歌提出了知识图谱的概念至今,知识图谱这一领域一直是科学研究和科技应用的前沿热点,其应用也涉及了从搜索到推荐等众多领域。目前,医学是知识图谱应用最广的垂直领域之一,也是目前国内外人工智能领域研究的热点。其中,在线医疗社区逐渐被大众熟知和使用,其中的医患问答文本具有很高的研究价值。因为医疗行业知识中专业用词多且在线医疗社区医患问答文本非结构化程度高、语言表述差异化大,这些问题导致了对齐进行医疗实体识别和关系抽取都是较为困难的,从而导致了医疗知识图谱构建困难重重。针对在线医疗社区中文本非结构化程度高的问题,提出基于CNN-Bi LSTM-CRF的实体识别模型,利用python语言在pytorch深度学习框架下分别使用卷积神经网络CNN(Convolutional Neural Networks)和双向长短记忆神经网络Bi LSTM(Bi-directional Long Short-Term Memory)两种深度学习对文本的不同特征进行抽取,在CNN识别出中文单个字的汉字级特征,在Bi LSTM中识别出结合上下文信息的特征,将识别出的特征进行融合放入条件随机场CRF(Conditional Random Fields)中完成对实体的识别。利用寻医问药网中关于乳腺癌疾病的问答文本的实验,整体的识别准确率高达92.32%。并分别与Bi LSTM-CRF和CNN-CRF模型在同一数据集上进行了对比验证,证明了所采用方法的有效性。针对由于地域差异以及个人语言表述习惯等原因导致医患问答文本存在着语序上的差异化表达的问题,采用BERT-Attention,充分利用左右两侧的双向的上下文信息来进行医疗实体间的关系抽取。利用python语言在pytorch深度学习框架下,采用寻医问药网中关于乳腺癌疾病的问答文本进行方法验证,模型的准确率达到了89.8%。并且通过与Glove-Attention和Bi GRU-Attention模型进行对比,表明BERT-Attention的方法明显优于其他模型,从而验证了方法的有效性。最后,基于已经识别出的实体和关系,本研究还利用可视化工具Echarts实现了对知识图谱的可视化,并进行了简单的分析。通过构建在线医疗社区医患问答文本的知识图谱,不仅为复杂文本实体识别及关系抽取工作提出新的解决思路,丰富了知识图谱技术在医学领域的研究方向,还提出了一种基于知识图谱智能问诊的实现,这种问诊方式更加直观生动而且可以缓解医生压力、提升回复效率同时推动个性化医疗行业的发展。
其他文献
抗生素抗性基因(Antibiotic Resistance Genes,ARGs)是细菌耐药性产生的根源,并可通过基因水平和垂直转移进行传播,比抗生素本身对环境和人类健康的危害更大。畜禽养殖场粪便是ARGs的储存库,而关于肉牛粪便中ARGs的分布特征及转移传播的影响因素研究较少。因此,本研究通过对来自宁夏的10个肉牛养殖场养殖情况调研,利用荧光定量PCR技术检测肉牛粪便中的ARGs丰度,结合粪便中
莫高窟作为世界文化遗产,历经北魏、西魏、北周、隋、唐、五代、宋、西夏、元等十多朝代,具有跨时代的意义。莫高窟壁画规模宏大,题材有佛像画、经变画、民族神话、装饰图案画和故事画,被称为“墙壁上的图书馆”。莫高窟285窟窟顶呈覆斗形顶,是古代十六国中北朝唯一具有明确纪年的洞窟,窟顶壁画天象图,运用丰富的色彩和繁复精美的纹样,描绘了一幅“悬空之景”,具有极高的艺术价值。近年来,随数字化技术的发展,数字化展
研究目的在国家积极推进分级诊疗制度建设的背景下,我国基层医疗机构儿童卫生服务能力弱化,儿童趋高就诊问题突出。本研究通过对广州市儿童家长开展问卷调查,分析儿童基层就医行为特征,运用结构方程模型探索影响因素间的作用机制并提出建议与对策,为构建科学有序的儿童就医秩序提供实证依据。研究方法基于安德森模型设计调查问卷,主要包括基本信息、就医行为特征等内容。以广州市0~14岁儿童家长为调查对象,资料收集的方法
2022年中共中央一号文件的发布,提出要加大力度全面推动乡村振兴重点工作,随着生产生活方式慢慢地发生转变,在经历当代的经济潮流之下,乡村开始出现空心化,传统生产工艺技术受到前所未有的挑战,生产文化逐渐丧失,空间的功能属性也变得破旧不堪,生产活力丧失。在保留传统文化精华的基础上,融合了设计元素,并将时代潮流与可持续发展策略相结合,将与传统文化相关的生产空间进行活化设计,使之得以延续与传承,是一项富有
随着大数据与工业的结合,煤炭行业逐步升级,生产力逐渐提高,煤炭运输的运力短缺问题促使带式输送机朝着大型化、高速化、智能化的方向发展,导致带式输送机托辊轴承的工作强度越来越大,发生故障的概率也越来越高。托辊轴承一旦失效,会造成不可预估的损失。为此,本文旨在提高带式输送机的智能运行与维护的可靠性和安全性,开展对带式输送机托辊轴承故障的智能诊断与寿命预测的研究。针对托辊轴承早期微弱故障信号在恶劣工况下故
小说与戏剧的发展有着紧密联系,不少小说家从戏剧中汲取养料以哺育小说发展,小说中融入戏剧文化因子成为一股潮流,而真正将这股潮流推向新高度的作家就是陈彦。陈彦作为“多面手”,不仅能写戏剧剧本和歌词,还创作了四部长篇小说。陈彦几十年的戏剧创作经验,为其小说写作提供独特视角。陈彦的四部小说具有丰富的戏剧元素,戏剧元素成为深入其小说肌理的重要因子。陈彦小说的独特性为研究者提供了充分的挖掘和阐释空间。论文着眼
隐喻不仅是一种语言现象,也是一种认知世界的方式。既然隐喻离不开思维和认知,那么隐喻不仅应存在于文本,也应出现在图像、音乐、手势等非文本语言中。作为语言现象,隐喻并非中立的,反而隐含着使用者的意识形态。尽管已有研究多关注隐喻背后的原因,但少有人探究多模态隐喻背后的意识形态,且在多模态隐喻识别和意识形态分析上缺乏较为系统的研究方法。本研究选取431幅来自中国新闻漫画网(https://www.news
师生支持是学习者从老师和同伴处感知到的情感上和学业上的支持与帮助,是一种校园中的社会支持。作为一种保护性因素,情绪智力指个体感知、调节、管理、使用情绪的能力,是近年来情绪研究的热点之一。研究显示,师生支持和情绪智力均对英语学习有着一定的积极影响。同时,现有研究还表明社会支持与情绪智力关系密切,但有关特殊情境下的社会支持(如师生支持)和情绪智力的相关性研究还不多见,具体到两者在某一学科学习中的关系研
伴随着台湾奶茶的流行,新式现制茶饮被全球众多消费者所喜爱,逐渐成为大家平时经常饮用的饮品。现在,我国的现制茶饮市场被少数知名品牌所垄断,如一点点、蜜雪冰城、书亦烧仙草等,品牌彼此间存在较大的竞争。同时,也有很多新的现制茶饮品牌开始加入到现制茶饮市场的竞争中来。本文的研究对象——恬恬夏雪,是一家2008年在保定市成立的现制茶饮品牌,目前店面主要分布在保定市和河北省内几个城市,市场份额较低、营销效果不
二十世纪初,中国教育学独立胚胎尚未成熟之时,西方教育学乘载西学东渐之风传入中国,传播主体正是中国留学生。五四运动后,中国留学生大部队从取法日本转为仿效美国,而聚集了众多一流教育学者的哥伦比亚大学师范学院正是美国教育学的风向标和发源地,背负教育救国理想的中国学生纷纷来到哥大师院探寻美国教育学先进的奥秘。博士学位论文代表着中国学生接受美国教育学最为精华的成果,记载着他们在西方影响下寻求中国教育学早期发