逻辑规则增强的中医实体表示学习与应用研究

来源 :华北理工大学 | 被引量 : 0次 | 上传用户:roseis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医典籍是中医学的精华,文本的向量化转换作为中医文本处理任务的基础工作,高质量、特征信息丰富的向量表示能够在源头上保障中医领域下游实体识别等任务的质量,对于中医文本的智能化学习与应用具有重要作用。深度预训练表示模型BERT凭借多层特征提取器的叠加,从而生成富含语义和语法信息的向量表示,但模型的参数规模大,进而导致所需的数据规模大。与此同时,虽然浅层神经网络模型CBOW结构简单,但它对于句子中的词语同等对待,从而忽略了句子内不同成分表示的语义信息以及句子固有的词序信息。为了构建较低计算复杂度的轻量化词表示模型,并使词向量保留丰富的中医文本特征信息,主要做了以下工作:1)根据“动核结构”理论从文本句式和词汇两个方面研究中医文本中蕴含的语言逻辑。利用以动词为核心的固定句式结构以及句子内的不同语法逻辑,制定了9种以动词为核心的句义表征规则及不同语法逻辑词的分类标准,进而增强词表示模型对中医文本语义特征的提取能力。2)针对浅层词表示模型CBOW对文本的语义和语法特征提取能力较弱的问题,提出了一种基于语义逻辑规则并融合词性和词序等语法逻辑的增强词表示模型。该模型对于动词中心词,利用句义表征规则匹配句子结构来提取句子的语义信息;对于非动词中心词,利用不同词语对句义的不同语义贡献作用,强化强语法逻辑词在词向量生成过程中的作用;然后通过卷积操作提取词序特征,并在词向量生成阶段引入同、反义词以及类比词表来进一步提升词向量对相关语义信息的表征效果。3)在内在相似度分析和外在定量比较两方面进行了多组实验,实验结果表明,课题提出的逻辑规则增强模型在语义相似度分析和实体识别任务中均取得了较好的效果。在实体识别任务中,相较于传统CBOW模型F1值提高了4.66%。该模型为轻量化词表示模型,与预训练语言模型BERT相比训练时间缩短了51%,并在资源占用等方面更具优势。图26幅;表17个;参63篇。
其他文献
<正>进入新时代,教育教学改革正如火如荼地推进,高中思想政治在新高考改革中更加重视以时事政治为载体考查本学科的核心主干知识。因此,教师要根据教育教学改革的需要,立足新教材,依托新高考,不断更新自己的教育教学理念,创新教育教学方式,将时事政治有效地应用于课堂,进而打造高效政治课堂。
期刊
甘露糖赤藓糖醇脂(mannosylerythritol lipids,MELs)是目前研究较为广泛的糖脂类生物表面活性剂之一,具有良好的表/界面活性、优异的生物活性以及卓越的生物相容性,在日化、制药、环保、食品、农业等领域具有良好的应用前景。然而,MELs受限于发酵生产水平较低、生产规模小、下游分离难度大等问题,由此造成的高昂生产成本限制了其与化学表面活性剂的竞争。而高附加值的应用也对MELs的结
学位
采用氧嗪酸钾建立高尿酸血症大鼠模型,分别以别嘌醇(阳性药物对照)、低、中、高剂量刺梨提取物对大鼠进行给药,使用LC-MS技术对大鼠血清进行非靶向定性解析,运用多元统计方法进行大鼠血清数据分析并筛选出差异代谢物,通过MBRole 2.0通路分析功能进行代谢途径分析。结果显示,不同剂量的刺梨提取物均能降低高尿酸血症大鼠的尿酸水平,并在血清中鉴定出242种代谢物。在变量重要性投影(VIP)值>1、P值<
期刊
随着当前各种交通方式的繁荣发展,旅客对运输服务有着更高的要求。铁路企业必须提供高质量的运输服务和提高自己的收益水平以提升市场竞争力。作为运输组织的核心,开行方案的编制质量与旅客和运输企业的利益密切相关,如何判断开行方案的优劣及如何对开行方案进行优化是当前迫切需要解决的问题。然而不同高铁线路情况多样,输送的客流不同,评价标准与优化目标也不尽相同。基于此,本文研究了一种在线路分类条件下系统性高且适用性
学位
在露天矿山的开采过程中,由于边坡失稳而引发的滑坡、崩塌等地质灾害通常具有较强的破坏性,其造成的损失往往是巨大的。本课题以长山壕金矿作为研究区,近些年来,在长山壕金矿东北、西南两个采场转入深部开采后,发生了多起不同程度的边坡失稳破坏情况,严重威胁到露天采矿生产作业的安全,对经济效益亦造成了巨大影响。依据露天采场边坡危险程度的不同对研究区域进行划分,对露天采场边坡的安全防护、滑坡预警等工作的实施具有指
学位
当前,我国的空气污染已经成为公众日益关注的环境和社会问题之一。空气污染不仅给生态环境带来了严重负担,还对人类身心健康产生极大负面影响。对空气质量进行准确分析与预测已经成为控制空气污染、改善空气质量的重要措施。以北京多站点空气质量数据为研究对象,针对空气质量数据特点,基于递归图理论,挖掘空气质量影响因素的动态相关性,利用深度学习对空气质量时序数据进行建模研究。具体地,包含以下三个方面:首先,为充分挖
学位
钢琴艺术是当下音乐乐器艺术的重要组成,甚至占据着核心地位,从欧洲的歌剧到中国的民歌,从传统的音乐演奏到现代的乐器混合,都有着钢琴表演的身影与形象。而对于我国钢琴艺术的发展,不仅要学习和借鉴欧洲钢琴表演的演奏技术、艺术特征,更要与我国传统文化进行有效融合,形成和发展具有中国特色的钢琴表演艺术。随着国内专家和表演者们的不断尝试,先后涌现出一批优秀的钢琴作品,有的作品融合了中国传统经典的戏曲元素,在钢琴
期刊
时事政治是呈现当今社会焦点问题的一种形式,也是高中政治的重要组成部分。在教育改革的背景下,教师应与时俱进,优化并调整课堂教学结构,充分发挥时事政治的优势,将其合理应用在政治教学中,在激发学生学习兴趣的同时开阔学生眼界,致力于将学生培养为高素质、全能型的优秀人才。本文阐述了时事政治在高中政治教学中的作用,并针对时事政治的应用现状提出了几点策略,希望能够促进学生思维综合发展。
期刊
在突发公共卫生事件中,大数据、云计算等信息技术被普遍应用于联防联控,但也增加了个人信息的安全风险,个人信息泄露的事件屡屡发生。为保护突发公共事件中的个人信息安全,首先,研究突发公共卫生事件对个人信息保护的挑战,明确突发公共卫生事件的定义和特征,介绍个人信息在突发公共卫生事件中具有高度敏感性、范围性、法益综合性等特征,阐述收集个人信息的用途,指出利用个人信息具有必要性,不能减少利用只能做好保护工作,
学位
当事人的陈述是重要的法定证据之一,它能够在案件审理中提供很多关键性材料,在法官自由心证的形成过程中占据非常重要的地位,也决定了案件能否得到公正合理的裁决。同时当事人真实陈述还可以使法院在调查案件证据时不会浪费大量时间,提升我国民事案件的审判效率,有利于法院作出公平公正的判决。假若当事人虚假陈述,将会掩盖案情真实情况,使法官对案件作出错误判断,这将使诉讼程序变得漫长,继而让法官作出的判决不公,有损司
学位