论文部分内容阅读
众包平台致力于将一些复杂的难以由计算机解决的任务分配给一些众包工人来完成,汇集了人类和计算机共同的智慧,是目前非常热门的主题。在众包平台的任务分配中,为了得到一个更高的效率和更好的效益,需要做到将合适的任务分配给合适的某个工人或一组工人来完成。为了达到这个目的,需要解决三个方面的问题,一是在任务分配之前的众包工人建模,它是众包任务高质量分配的基础;二是实时众包任务分配的算法,它是众包任务高质量分配的核心;三是对众包任务质量的提升,它是众包任务高质量的补充。为了解决这些问题,本文的主要工作和形成的主要成果如下。首先,我们形式化地定义了一个基于反馈的协作众包任务分配问题,同时证明了它的复杂性为NP难。接下来,针对于众包工人建模问题,我们定量地建立了两种模型用来度量众包工人的技能和匹配度。一种是针对于任务与单个多技能工人的匹配,另一种是针对于任务与协作的一组工人的匹配。在第三部分,结合前面提出的技能模型,我们研究了具体的众包任务分配算法FCCSA。这个算法将技能高的工人尽量平均分配给了不同任务,同时动态更新系统对于工人的技能和亲密度信息,从而完成动态的任务分配。第四部分中,我们针对某一类众包任务提出了一种基于主动学习的质量提升方法,这个方法主要依据于一个双向主动学习的框架,在众包工人的工作当中适当加入了“黄金样本”,同时重做一些之前的任务。根据不同行为可能带来的未来收益,我们提出了BSWT算法,可以在众包任务的过程中,既提升了众包工人技能水平,又提升了众包任务质量。最后,我们设计了多组实验,均在真实众包平台上运行的实验。实验主要分为两个主要部分,第一部分使用复杂众包任务,共同测试了我们的工人模型和任务分配算法,其中包括了一次性的问卷实验,和长时间运行的实验。实验的结果均表明了我们提出的工人模型与FCC-SA算法与相关工作相比,可以得到更佳的任务匹配质量。第二部分的实验基于打标签众包任务,主要测试了我们提出的BSWT算法与其他相关主动学习算法的性能比较,实验结果表明了,我们的BSWT算法使得分类器训练得到最好的训练结果,同时提高了众包工人的技能水平。