论文部分内容阅读
近年来随着大数据的广泛普及和应用,数据资源的价值逐步得到重视和认可,数据交易需求也在不断增加。数据交易平台是数据交易行为的重要载体,可以促进数据资源整合、规范交易行为、降低交易成本,成为当前各地促进数据流通的主要举措之一。然而,从数据平台整体发展水平来看,当前大数据交易仍然面临着诸多问题:(1)数据供需不对称使得数据交易难以满足社会有效需求,数据成交率和成交额不高;(2)数据开放进程缓慢,“数据孤岛”现象在一定程度上制约了数据交易整体规模,影响数据变现能力;(3)数据交易过程中无法有效破解数据定价难题。针对上述存在的问题,本文提出将移动感知技术应用于数据交易市场,以此解决数据资源供需不平衡问题。然而构建基于移动感知的数据交易市场仍然面临着传统移动感知和数据交易平台不曾遇到的难题。在移动群体感知中,由于需要普通人群作为参与者加入到感知任务活动中去收集并分享数据,因此也给数据的收集工作带来了更多的机遇和挑战。此外,数据质量不高、数据价值难以衡量,缺乏有效数据定价规则,已经成为制约数据交易和流通的不利因素。正因为如此,如何选择合适的参与者提供高质量的感知数据,以及如何对收集到的数据制定合理价格是移动感知数据市场所面临的并且要尽快解决的重要挑战。本文围绕移动感知数据市场中的参与者选择以及数据定价问题,展开深入的研究,并作出如下四方面主要贡献。针对如何有效选择感知任务参与者来实现高质量数据收集的问题,本文提出了两种有效策略来分别解决有约束和无约束环境下的参与者选择问题:(1)提出一种基于空间覆盖的参与者选择策略。为在预算有限背景下实现最大化数据平台收益,本文考虑从感知任务参与者可预测的移动性出发,提出将空间覆盖作为参与者贡献数据质量的重要度量指标,以此构建基于空间覆盖的参与者选择模型,为使问题得到解决,本文设计了一个新颖的贪婪遗传算法来得到问题的最佳解决方案。通过真实和模拟数据集的实验,验证了所提算法能够在预算有限背景下获得更多的高质量感知数据。(2)提出一种在无约束环境下基于边际主义的参与者选择策略。首先本文将参与者的声誉和参与意愿的联合作为评价参与者收集感知数据质量的度量标准,并将其建模为参与者的服务质量(QoS),以此构建多种收益成本模型。其次为最大化数据平台的总体收益,本文借鉴微观经济学中边际主义原则,即希望只有当新加入的一个参与者的边际收益高于支付成本时,才选择该参与者。本文将该方案建模为参与者选择的边际问题,然后提出了一个带有退火机制的贪婪随机自适应搜索算法(GRASP-AR),以最大化感知数据收益。最后通过在真实数据集和模拟数据集的大量实验评估可以清楚的验证本文所提出的算法在参与者选择问题上的高效性。针对如何对数据制定合理的价格,本文也提出了两种有效的数据定价模型:(3)提出一种基于质量等级的通用数据定价模型。本文首先提出一种加权线性数据质量评分模型,该模型包括14个数据质量标准,其中大部分可以通过计算方式进行评估。根据每种质量标准的分数,可以计算数据集的总体质量分数。其次为了实现数据产品自动化等级分化,本文应用平方根函数将连续质量分数离散化为质量等级,并提出基于质量等级的效用模型。然后从数据科学的视角,验证了候选效用函数的合理性。为充分考虑消费者的购买意愿,允许数据平台通过调整数据质量向数据消费者出售数据产品,最后本文还构建了数据平台利润最大化模型,并根据KKT条件推导出不同质量等级的最优数据定价。(4)提出一种基于敏感等级的匿名化个人数据定价模型。个人数据具有很强的隐私属性,因此本文首先提出一个公平的信息损失补偿方案,从数据提供者视角,他们可以依据各自的敏感态度得到相应的补偿,从数据平台视角考虑,他们的运营成本得到了有效控制。然后提出一个非线性数学模型,用于描述消费者自我选择行为与个人数据效用之间的关系。最后,本文制定了以数据平台为领导者,消费者为追随者的双层优化模型来最大化数据平台利润,数据平台从具有隐私意识的人群中收集个人数据,并向数据消费者提供购买服务。通过最佳购买费用和数据敏感等级的优化来实现利润最大化。