基于MEC-CKG的常识领域问答系统的研究与实现

来源 :江苏大学 | 被引量 : 0次 | 上传用户:cycblb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,传统搜索引擎由于准确率低和广告较多等问题,渐渐无法满足用户检索信息的需求。而基于知识图谱的问答系统,采用结构化方法存储数据信息,允许用户运用自然语言进行查询,系统对用户查询的问题进行解析,返回相对准确的答案。正因基于知识图谱的问答系统检索信息高效性,其研究和应用越来越广泛,在这些研究当中,问答系统回答问题的准确率是研究的重点,而知识图谱疏性和多实体问题是影响准确率的重要因素,本文将重点围绕这些因素进行研究。(1)针对知识图谱稀疏影响知识图谱问答系统准确率的情况,改进知识图谱嵌入技术,引入强化学习方法,提出了RL+PTrans E算法,在一定程度上降低了知识图谱的稀疏性。使用表示学习模型对知识图谱进行训练,使三元组获得预期奖励。将知识图谱的推理过程看作一个马尔可夫决策过程,进行关系推理,使用策略网络,得到缺少的关系,在一定程度上降低了知识图谱的稀疏性。在特定数据集的结果表明,RL+PTrans E算法与其他路径推理模型比,推理预测效果更好。实验结果表明,RL+PTrans E算法的MRR达到了47.4%,优于其他模型,验证了算法的可行性和有效性。(2)针对问答系统的问句多实体的情况,提出了基于中文知识图谱的多实体桥接(Multi Entity Connection based on Chinese Knowledge Graph,MEC-CKG)算法,对问句中多实体进行识别,提升问答系统回答的准确率。通过对问句的属性及包含的实体进行识别,然后进行实体链接,同时生成候选查询路径,计算路径与问句的相似度,取相对比较优的查询路径。最后在知识图谱中进行查询操作,判断是否存在搜索结果一致的情况,如果在一致,则生成新查询路径,加入候选路径中,计算相似度,返回相似度最高的查询结果。实验结果表明,MEC-CKG算法的平均F1值达到了67.14%,验证了算法的可行性和有效性。(3)设计并实现了智能常识问答的原型系统。该系统基于C/S架构,使用MVP模式,以Java和Python为开发语言,采用Neo4j图数据库对知识图谱进行读写操作。原型系统以手机应用程序的形式展现。用户登录系统后,输入中文问句后,可以快速得到问题的答案,还可查看知识图谱。原型系统对用户提出的问题进行统计分析,将热门提问推荐给用户,丰富用户的知识面。
其他文献
靶向给药系统纳米载体被广泛研究,然而大多数纳米载体缺乏对肿瘤靶向性和特异性,并且容易被体内免疫系统识别为异物清除,使得肿瘤治疗效果仍然不令人满意。因此,迫切需要开发更安全和更有效的方法。由于间充质干细胞具备向恶性位点迁移并输送抗肿瘤药物的能力,且自身独有的主动选择性、肿瘤归巢性及免疫耐受性等特点使得间充质干细胞有望成为一种极具研究前景的肿瘤靶向载体。本研究以脐带间充质干细胞(UCMSCs)为载体,
学位
内质网是细胞合成蛋白质的关键细胞器,主要负责蛋白质的折叠和修饰。病毒的增殖会在内质网中聚集大量病毒蛋白,内质网环境遭受巨大压力,往往在表达过程中造成大量未折叠和错误蛋白的堆积,最终诱导内质网应激反应(ER stress)。而未折叠蛋白反应(unfolded protein response,UPR)则是细胞随之产生的一系列适应性反应,缓解内质网压力,病毒的增殖过程往往也和该过程息息相关。内质网伴侣
学位
目的:头颈部鳞状细胞癌(Head and Neck Squamous Cell Carcinoma,HNSCC)是一组发生于头颈部的恶性肿瘤,发病率世界排名第六。放疗是HNSCC患者除手术外的主要治疗方式,但是约有15%至40%的晚期患者在放疗后出现局部复发,在放疗中产生辐射抗性是导致治疗效果差的主要原因。抗辐射和肿瘤细胞的缺氧微环境之间的交互作用会影响HNSCC的发展,更清楚地了解HNSCC肿瘤
学位
氟硼二吡咯(BODIPY)因荧光量子产率高、稳定性好、半峰宽度窄、发射波长长等优点,被广泛应用于荧光探针领域,尤其是用于协助肿瘤诊断的成像领域。嘧啶作为在临床上使用了六十多年的抗肿瘤药物,在抗肿瘤活性方面有着巨大的影响力。将不同功能的基团(嘧啶,BODIPY)结合成为一个有机体,设计并合成了一系列新型双功能BODIPY-嘧啶衍生物,并研究了其光谱性质和生物活性,具体研究内容包括:(1)将具有良好生
学位
胰腺癌是一种致命的恶性肿瘤,在2018年公布的全球癌症死亡率中,胰腺癌的死亡率排名较高,已经排在了第七位,占所有癌症死亡的4.5%。胰腺影像自动准确分割是计算机辅助诊断胰腺癌的重要前提,其自动分割对于医学研究、临床诊断、病理分析、手术计划等医疗活动有着研究和应用价值。器官的自动分割是医学图像分析中的一个基本问题,更是计算机辅助诊断的关键。胰腺体积小且背景干扰过大,相对于其他腹部器官如肝、肾的分割更
学位
随着计算机网络带宽的迅速增加以及各种网络服务的广泛应用,社会生活对于网络流量需求越来越大。由于网络规模不断扩张且管理日益复杂,导致网络维护任务艰巨,因此网络流量预测问题日益重要并受到广泛关注。精准预判网络流量的变化趋势,可以帮助运营商准确预测网络的使用情况,合理分配并高效利用网络资源,以满足用户日益增长和多样化的需求。将自适应滤波理论应用于网络流量的建模和预测,可以有效解决预测模型无法实时自适应更
学位
随着近年来老龄化发展趋势不断深化,人们罹患慢性病的几率不断攀升,社会还面临医疗资源紧张和地区间医疗资源分配不均衡的问题,将给国民经济发展和社会生活水平的提高带来极大的阻碍。无线体域网(Wireless Body Area Network,WBAN)是由部署在被检测者体内、体表或体外的微型传感器所组建的独特无线传感器网络,各节点协作地感知、采集和处理WBAN(Wireless Body Area N
学位
肝癌由于高发病率和高死亡率,现已成为影响人体生命的重点病症之一。肝癌的早期检测与治疗能有效降低肝癌的死亡率,医学影像是检测肝癌的有效手段。近年来,我国肝癌患者数量急剧上升,医学影像的数量每天呈指数增长,导致影像科医生工作量大幅增加。为了减轻医生的负担,许多学者致力于利用计算机技术实现海量医学影像的精准分类。随着深度学习的兴起,深度学习结合计算机技术辅助医生诊断已成为一种趋势。因此,本文结合深度学习
学位
肝脏作为人体不可或缺的器官之一,对人体生命活动及新陈代谢起着重要的作用,人类生活环境的变化和不良生活习惯增加了肝脏疾病发生的风险。手术治疗是肝脏疾病治疗的重要手断,治疗中,掌握病人肝内血管分布十分重要,血管分布的复杂性要求在手术过程中必须注意保护肝脏重要血管,避免其出现损伤。准确的肝脏血管图像有助于医生分析掌握病人肝血管走向,制定出有效的手术规划,保证有效治疗。在人工智能技术发展如火如荼的今天,利
学位
个性化推荐系统是互联网和电子商务持续深入发展的结果,个性化推荐可以准确快速地帮助人们从资源爆炸式增长的网络中获取有用信息。然而,随着“互联网+教育”发展战略的提出,个性化推荐在教育领域还有待发展。近年来在线教育迅速发展,各种在线学习资源与日俱增,导致学生陷入“资源迷航”,如何从海量资源中获取适合的习题资源成为研究热点。习题推荐系统可以帮助学生高效地学习,具有很重要的意义。本研究以初中数学习题为研究
学位