【摘 要】
:
阅读理解任务是在给定的单篇文本上,要求计算机根据文本的内容对相应的问题作出回答。阅读理解是人工智能领域的一个研究热点,涉及多种复杂的自然语言处理技术。本文以北京语
论文部分内容阅读
阅读理解任务是在给定的单篇文本上,要求计算机根据文本的内容对相应的问题作出回答。阅读理解是人工智能领域的一个研究热点,涉及多种复杂的自然语言处理技术。本文以北京语文高考为背景做阅读理解研究。北京语文高考中的阅读理解材料有两类,分别为科技文和文学作品。涉及的题型有选择题和问答题,其中选择题包括文意理解题、词语理解题、指代消解题等;问答题包括句子理解题、标题理解题、抽取概括题等。本文着重针对阅读理解选择题中的词义判断题进行研究,主要工作如下:(1)针对词义判断题提出了一个基于支持度计算的解答策略:根据文档中相关句对释义的支持程度计算支持度,然后对支持度进行排序来达到解答的目的。(2)从词序和词义出发,提出了三种支持度计算方法,分别为:基于语言模型的支持度、基于点互信息的支持度、基于句子相似度的支持度,来刻画题中被解释词语所属句子的句子连贯性和语义相似度。(3)针对词义判断题题目数量较少,尝试采用同义词替换法进行词义判断数据集的自动生成,以弥补数据集不足的问题。(4)实现了一个词义判断题解答系统。在北京高考语文真题、高考模拟题数据集上进行测试,三种方法的选项正确率分别为62.5%、75%、62.5%,在自动生成数据集上进行测试的选项正确率分别为67.5%、65.5%、64%。可以看出,基于支持度计算的解答策略有效解决了词义判断问题,推动了类似阅读理解题目的解答。但是所提策略仍有许多不足,如该策略主要是从词匹配的角度来研究,并没有从语义角度来解答该问题。
其他文献
当今信息社会,更大的储存容量、更快的读写速度、更高的数据安全性及更低的功耗是人们对存储器性能的要求,这就使得存储器件的尺寸不断减小。尺寸减小会导致漏电增大,数据安
三维属性数据场的空间插值是三维地质建模中重要的研究领域。本文针对物质具有一定的层理构造,即在顺层方向属性相对均一、变化较慢,而在穿层方向(即垂直于层面的方向)变化较
移动人体检测在楼宇监控、文物保护、边界检测以及火灾或地震中存活人员的检测等领域有着重要的作用。传统的移动人体检测基于特殊的物理硬件,在部署以及应用范围内具有很大
目的:研究雄激素受体(AR)在乳腺癌中的表达,及其与ER、PR、HER2和临床病理特征之间的关系,并探究AR在乳腺癌中的发生、发展及预后中的作用。方法:采用免疫组织化学法检测AR及
研究目的:芒果苷是一种天然的黄酮类化合物,已有文献[1]表明芒果苷可以抑制鼻咽癌细胞的增殖,但其作用机理尚未清楚。本研究通过运用体外细胞培养法,经不同浓度的芒果苷处理
令x0:M → Sn为球空间S中的共形子流形.我们在本文中给出了球空间中共形子流形的共形不变量的等度表达,并计算了x0的Willmore泛函的第一和第二变分公式.我们也计算了Sn中Clif
随着客户需求多变、市场竞争加剧及土地资源日益紧张等外部环境变化,现今制造企业突显出多态性的特点,其在布局方面的作业单元繁多、物流路线混乱、生产过程高碳粗放等问题,
经典的等周不等式描述了凸体的两个内蕴不变量表面积A与体积V之间的关系.本文研究卵形域K的边界(?)K的曲率积分与卵形域K的表面积及体积之间的关系.对于欧式空间Rn中给定的卵
自20世纪以来,人类进入了以“计算机”为代表的信息化时代,推动了人类社会的进步以及科学技术的发展。1936年,著名的英国数学家阿兰·麦席森·图灵提出了一种抽象的计算模型,
受国际金融危机、欧洲债务危机的影响,以及国内人民币升值、通货膨胀、产业转型升级、劳动力成本上升、原材料上涨、制造成本上升、环保要求等多种因素冲击,当前国际与国内经