众包技术中开放性答案的决策算法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:caway1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中往往存在一些计算机难以处理或者处理效果不佳的问题,如给图像打标签、判断两个记录是不是同一个实体等。众包直接将这些问题发布到互联网上,通过集合互联网上的未知大众来解决这些传统计算机难以单独处理的问题。已有的答案决策方法存在一定的局限性:一方面,以往工人的质量模型矩阵大小是固定的,仅适用于候选答案固定的情形。另一方面,众包平台上的问题类型有填空题、选择题(分单选题和多选题)、选择和填空的混合等,以往的答案决策算法主要是基于单选题提出的,不能兼容多种答案类型,尤其无法处理包含开放性答案的问题。针对以上问题,本文综合考虑多种答案类型,提出了一种基于贝叶斯的开放性答案决策算法。首先,利用工人以往表现,建立了工人质量模型,该模型不受候选答案个数影响;其次,利用Jaro-Winkler Distance方法计算填空答案间的相似度,以此将填空内容扩展为候选选项,决策时考虑到了填空答案间的相互影响,认为相似度较大的一组答案很可能为相同的答案。此外,以往的决策中,候选答案的先验概率是未知的,本文根据机器算法给出的先验知识以及扩展答案情况,对候选答案的先验概率进行了预处理。相关实验表明,本文的决策算法能够综合处理多种答案类型,对开放性答案以及先验概率的处理,提高了算法的准确性。由于多选题答案决策过程是一个NP-hard问题,本文对多选题的答案决策算法提出了基于剪枝的优化策略,减少了需要计算后验概率的候选答案个数。相关实验表明,本文的优化策略,在保障决策算法准确一致的情况下,降低了算法的运行时间。
其他文献
电子在20世纪的科技革命中发挥了重要的作用。在强激光与物质的相互作用下,电子的再散射会导致许多有趣的物理现象,例如高次谐波产生(HHG),高阶阈上电离(HATI),以及非次序双
环保行政强制加处罚款,顾名思义,指的是环保行政当事人在环保行政机关规定的期限内拒不履行或不按照规定履行行政义务的情况下,环保行政机关以增加罚款数额的方式迫使行政当
AtIQM2由At3G13600编码,含有1个IQ基序,是一个钙调素结合蛋白(calmodulin-binding protein,CaMBP),参与自主途径成花调控。适时地开花对植物的生长繁殖至关重要,这一过程受环
作文教学是一门人文性与工具性并存,综合性极强的课程。即在夯实学生写作知识的基础上,实施规范化协作训练,获得艺术的熏陶,培养学生欣赏美、创作美的能力,让学生通过系统地
图像文本检测是指从图像中定位出文本区域,该技术广泛应用于图像检索、智能教育等领域。本课题源于移动应用广告文案分析的实际需求,此场景下文本多为水平分布或者接近水平分
环境保护公私协作契约是指公主体与私主体为明确其在环境保护合作中的权利义务而订立的以实现环境污染治理、生态环境修复以及环境保护公共产品与公共服务供给为目的的合同。
本世纪以来,随着生活与科技水平的提升,民众对健康问题的关注日益增多。智能医疗问答系统,能够快速反馈用户所需的专业医学信息,具有非常重要的研究与应用价值。目前,大多数
分子通信(Molecular Communication,MC)是利用生物化学信号在系统之间实现信息交换的通信技术,涉及通信理论、生物技术和化学的交叉学科领域。与传统的电磁波通信相比,以分子
区块链作为数字货币的技术支撑,具有去中心化、减信任、防篡改的特性,其采用密码学、分布式和博弈论等相关技术,解决中心化公司的高成本、低效率和数据所有权被垄断的问题。
很多学者从混沌系统的非线性特性、物理学特性、动力学特性等不同方面,研究出各种新型方法来产生如多翼混沌系统、多涡卷混沌系统、时滞混沌系统等功能各异的混沌系统,而利用