【摘 要】
:
人机对话交互在人们的日常生活中越来越普遍,甚至成为人们不可缺少的生活习惯。人机对话包括闲聊式对话、问答型对话、任务型对话三种。不同类型的人机对话需要不同的算法模型。本文研究设计基于多模型融合的任务型对话系统,利用Python进行多种模型的仿真。本文首先研究了现有的中文表示方法,包括TF-IDF、word2vec、CWE、JWE、BERT等,并在JWE模型的基础上进行改进提出了多层次JWE模型。此模
论文部分内容阅读
人机对话交互在人们的日常生活中越来越普遍,甚至成为人们不可缺少的生活习惯。人机对话包括闲聊式对话、问答型对话、任务型对话三种。不同类型的人机对话需要不同的算法模型。本文研究设计基于多模型融合的任务型对话系统,利用Python进行多种模型的仿真。本文首先研究了现有的中文表示方法,包括TF-IDF、word2vec、CWE、JWE、BERT等,并在JWE模型的基础上进行改进提出了多层次JWE模型。此模型通过联合预测目标词汇中的词语、字符、子字符等不同层次的信息,充分利用中文词汇内部的语义信息,提升了词向量在文本分类等任务中的表现能力。其次,在各类词嵌入模型的基础上,研究检索匹配模型的算法流程,包括BM25、WMD、SMN等。在多轮对话应用背景下,提出基于加权SVD分解的句子语义表示算法,此算法首先对句子词嵌入矩阵进行加权,然后对加权矩阵进行SVD分解,保留前k个最大奇异值对应的右向量并相加,得到句子的向量表示。此算法能够保留句子中真实有效的语义信息,去除句子词嵌入矩阵中的噪声。在JDDC数据集上的仿真表明,在BLEU为评测指标下,此算法比直接对句子嵌入矩阵求平均方法提高0.08~0.13,相比TF-IDF加权求平均的方法提高0.05~0.09。最后,研究基于LSTM、Transformer等模块的Seq2seq模型在对话系统中的应用。针对JDDC对话数据集中的高频场景,进行挖掘提炼,得到发票、物流等数十个场景并构建基于规则的对话模块。基于检索匹配模型、生成模型、规则模型,提出新的多模型融合的对话框架。此框架将用户的问题输入到规则模型中产生回复,如果没有匹配到相应的回复,则输入到检索模型和生成模型中,分别产生多个回复,然后输入到重排模型中,选择匹配度最高的回复作为对话系统的回复。此框架充分利用各模型的优点,提高了对话系统的稳定性和鲁棒性。
其他文献
明代中叶以后,阳明后学中的某些弊端日益凸显,尤其是对阳明心学“致良知”的曲解,使得阳明后学流于玄虚,心性修养工夫落不到实处。“心”之所发流于私欲,“心”的多重意义成为率性而为的理论依据,社会道德价值标准无法落实,当时的士大夫所形成的社会风气也呈现狂悖、放纵、空虚的病态。刘宗周生逢其时,其学术思想源于程朱、阳明之学,又与二者相分离而另成体系。他以“意”为“心之体”,重建道德本体,继而提出诚意、慎独的
有机磷阻燃剂在世界范围内的广泛应用使有机磷化合物不仅存于各种环境介质,还会通过接触、吸入等途径威胁人类健康,亟需寻求低成本和高效率降解方法。高级氧化法中的非均相光催化法,具有广谱、高效等优点,其关键在于开发具有光催化活性、且能产生自由基用于氧化有机污染物的固体光催化剂。金属有机框架(MOFs)材料因其结构和功能的多样性是近年热点新型材料之一,特别是具有光催化活性的MOFs,有望成为高效的光催化剂。
增程式电动汽车动力系统上采用电机直驱,由发动机和电池提供所需能量,被公认为是燃油车过渡到纯电动车的理想车型。作为整车开发的关键技术,增程式电动汽车的能量管理控制策略涉及发动机和电池的功率分配问题,直接影响整车的油耗、排放、动力等性能。通过深入研究能量管理控制策略,可以实现两个动力源之间合理的能量流动和模式切换,达到最佳控制效果。本文以一款增程轻卡为目标车型,进行增程式电动汽车的能量管理控制策略研究
无损检测(Nondestructive Testing,NDT)是工业检测领域的重要分支,象征着一个国家的工业发展水平,主要用来检测材料、零件和设备等表面与内部的缺陷或损伤。其中电磁涡流检测
目前,我国正由传统建筑业逐步向现代化建筑业过渡,西部地区作为我国的重点开发地区,其建筑业的发展状况不仅关乎我国的建筑业经济,还关乎到我国国民经济的发展,在这转型的关键时期,西部地区的建筑业发展状况如何、能否在保持稳定增长的同时顺利过渡等问题就显得十分重要。在减少资源与环境投入的前提下,提高建筑业生产效率,是提升建筑业绿色全要素生产率的有效途径。习近平总书记曾指出“绿水青山也是金山银山”,加之建筑业
“民以食为天”。农业是一个国家发展的根基,农业问题关乎国计民生。随着新中国的成立特别是改革开放以来我国的农业发展速度可谓突飞猛进。千禧年之后中央每年的一号文件更是直指农业发展中面临的重点、难点问题,明确我国政府致力于将农业现代化发展壮大的宏伟目标。农业行政执法工作的有效开展,直接关系到农村的社会稳定和农业经济的健康发展。2008年国家发布的《关于全面加强农业行政执法扎实推进综合执法的意见》指出农业
1920年代,国民革命的发展使得广州成为全国革命中心,也成为妇女解放运动的先行者。1927年《越华报》创立于广州市荔湾区,至1931年,成为广东发行量最大的一家报纸。本文通过对《越华报》中大量的有关女性的社会新闻进行研究,探讨它呈现出怎样的女性媒介形象,并分析其形成的原因,以此管窥民国时期女性的社会生活。本文以《越华报》1929—1936年间的女性社会新闻报道作为研究样本,从新闻社会史的视角出发,
自从有学者将双元理论引入外部知识搜索的研究,知识搜索双元与企业绩效的关系便颇受关注,也有学者研究影响知识搜索策略选择的因素。但针对知识搜索地理维度的划分仍欠缺关注,外部知识搜索前因研究还没有一个完整的理论框架作为支撑,知识搜索双元与企业绩效的关系也尚存争议。基于此,本论文从战略三脚架视角分析了知识搜索的前因以及知识搜索双元(本地搜索和非本地搜索的差异维度和交互维度)与企业绩效的关系。主要研究内容包
自1965年“解决投资争端国际中心”建立以来,ISDS机制一直深受各类投资协定的器重,以致成为国际投资协定的典型特征。由于早期国际投资协定奉行新自由主义的倾向,ISDS机制设计之初的架构也偏向于强调投资者私人利益的保护,却鲜少关注东道国规制权。而随着这种机制被广泛运用于国际投资争端的解决,其弊端也逐渐凸显。投资者享单方享有的诉权引发“滥诉”现象,ISDS机制的投资保护宗旨也致使仲裁庭裁决过程中过度
“核心素养”自提出以来便受到国内外学者的广泛关注。《义务教育数学课程标准(2011年版)》首次提出了10个“核心词”的概念,即数感、符号意识、空间观念、几何直观、数据分