面向特定域智能问答系统的研究与应用

来源 :青岛科技大学 | 被引量 : 1次 | 上传用户:gongjuntao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,搜索引擎成为人们获取信息的主要方式。人们只需要输入想查阅的关键词,搜索引擎即可返回相关的网页。然而,搜索引擎也有一些不足,比如关联页面多、内容繁琐等。因此,需要一种更为简单高效的获取信息的方式,故问答系统应运而生。面对网络的海量信息,特定域问答系统因其可行性高和用途广泛而备受关注。本文致力于面向特定域智能问答系统的研究,主要研究内容分为以下三个部分。(1)针对特定域的知识库自动构建方法。首先提出一种基于SVM及文本密度的网页信息提取方法,通过该方法可以有效定位网页正文信息并自动爬取;其次提出了一种文本主题划分及TextRank中心句提取的方法,该方法会自动对文本主题的中心句进行提取,并将中心句作为问答信息存储到知识库中;本文提出的知识库自动构建方法在实验和实际应用中都取得了良好的效果。(2)基于特定域的知识库检索的智能问答。采用布尔倒排序索引法从知识库过滤出候选回复集,然后使用相似度算法对候选回复集进行精确筛选得到最佳回复并返还给用户;本文提出了一种基于词向量及位置编码的Jaccard的相似度算法,实验结果表明,该方法不仅有较高的准确率,而且对词序有较好的辨识能力。(3)基于深度学习的多轮集成式问答。本文针对闲聊对话方面,提出一种基于检索式与生成式相结合的多轮集成式问答模型;实验结果表明,集成式模型要比单一模型在一定程度上表现更好,将此模型应用到特定域问答系统的闲聊模块中,取得了很好的效果。基于上述研究内容开发了基于历史领域的特定域智能问答系统。经系统测试,该系统不仅可以准确的回答历史领域的相关问题,而且在闲聊方面表现出色,满足了用户的基本需求。本文工作对于推动面向特定域的智能问答系统方面具有重要的理论和实际意义。
其他文献
随着科学技术的发展进步和工业生产的需要,实际工程系统的规模和复杂度都迅速提高,这意味着系统更容易出现故障以及故障会给系统带来更严重的影响。为确保系统的安全性和可靠
雷电灾害都不断地威胁着社会公共安全和人民生命财产安全,影响着我们日常的生产生活。对雷电的物理活动过程进行探究,准确的认识雷电活动机理,不仅是雷电科学研究发展的需求,
本论文主要研究氧化物薄膜及器件电致变色(EC)性能,制备/合成了非晶中嵌有纳米晶结构的纳米孔WO3薄膜和层状V2O5薄膜,探究了在H+、Li+、Na+、Mg2+、Al3+等多种传导离子电解质中
串行传输由于在高速数据传输下稳定可靠,且节约成本,而得到广泛应用。然而系统内部的处理仍然采用并行方式,这样一来并串转换SerDes(Serializer/Deserializer)芯片在高速数字
正在俄罗斯杜布纳联合核研究所(JINR)新建的重离子超导同步加速器(NICA)及其上的多功能探测器(MPD)主要用于研究高重子密度的夸克-胶子等离子体,其能量介于高、低能区之间。N
目的:炎症性肠病(Inflammatory bowel disease,IBD)和抑郁常互为因果,IBD的患者常诱发抑郁症状。中医学"肝郁脾虚"牵涉到情绪和消化功能的紊乱,包含了现代医学的IBD抑郁共病
聚类分析作为大数据研究与应用的重要技术工具,为通讯业、银行、保险以及各大电子商务领域中的应用研究提供理论支持。其中基于划分的聚类算法性能的优劣很大程度上取决于初
随着计算机网络和通信技术的快速发展,在工业、交通和通信等领域中,网络可靠性模型得到深入广泛的应用。在直径限定网络可靠性中冗余边的检测与删除对直径限制的可靠性的计算
以钨及其合金为典型代表的难熔金属材料在国防和民用工业领域均有重要工程应用。但是,极高的熔化温度一直阻碍着对其液态物理化学性质和快速凝固机理开展深入的理论研究。如
改革开放以来,货币政策信贷传递渠道一直是中国货币政策传递的主渠道。但是,2002年之后,货币政策信贷渠道的有效性和重要性备受质疑。从有效性来看,随着国内金融市场的不断完