多Agent系统环境下动态信任模型研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zengbiao2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多Agent系统,正朝着大规模、开放的、动态的和分布式结构的方向发展,在系统中拥有大量自私的 Agent,与其它 Agent交互时提供虚假信息或劣质服务来获得自己最大化利益。在任何时间Agent可以以不同角色进入或离开系统,因而具有自私性和不可靠性。在系统中建立信任机制不仅有利于增加Agent交互的可靠性且可以帮助Agent作出理性决策,因此信任机制在开放多Agent系统中有重要作用。  近年来,不同研究人员基于多Agent系统环境下提出了不同信任和信誉模型,然而当前信任模型都有不足之处:第一,基于概率论的 Beta分布信任模型仅能评价二元离散集,没有考虑到推荐第三方是否可信问题及算法难以适应动态环境变化;第二,基于马尔可夫决策过程和强化学习方法的信任模型假设 Agent知道自己所处的环境所有的信息,Agent在动态环境下缺乏学习和决策能力以及没有考虑到“维数灾”问题。  针对以上这些不足之处,本文提出基于狄利克雷分布的信任模型,以及基于机器学习理论的信任模型。本文主要内容和贡献包括如下方面:  (1)基于狄利克雷分布的信任模型  利用狄利克雷后验分布计算直接信任度,可以更加有效地避免策略性欺骗对计算直接信任的影响。为了得到最准确的推荐信息,使用最优无偏估计方法对推荐信任度进行估计。由于本文中是以第三方推荐作为计算信任度参考量的,所以就存在第三方是否可靠的问题,因此提出了层次过滤算法对第三方推荐得到信息进行过滤。  仿真实现表明信任模型能够有效抑制简单的,不诚实推荐和策略的恶意 Agent攻击。  (2)基于机器学习理论的信任模型研究  在多Agent部分可观察马尔可夫决策过程框架中加入信任能使Agent作出更好决策。由于Agent是隐状态,用信念状态来评估更新Agent交互状态。在交互状态评估函数中的转移概率分布和观察概率分布是部分可观察或完全未知的,因此采用贝叶斯学习方法学习未知参数。随着Agent交互次数不断增多,信念状态空间会出现“维数灾”问题。采用分解联合状态、行动和观察方法来压缩状态空间,并提出基于模型贝叶斯强化学习算法思想的多Agent信念状态空间压缩算法寻找最优值函数和策略。  仿真结果表明该算法能有效抑制恶意Agent数量,并使得Agent获得最大化期望回报。
其他文献
语义Web服务是传统的Web服务在最新的语义Web技术下的延伸,能够使网络环境下异构Web服务的组合过程呈现运行时的动态性、自动化和智能化等特征,具有非常重要和广泛的应用前景
测试用例的共享复用是提高软件测试效率和质量的有效方法,逐渐成为软件测试领域研究的热点。本文在对国内外软件测试领域研究现状的分析基础上,发现测试复用领域的研究还存在
来自中国互联网信息中心的数据称,互联网数字分配机构地址池中的 IPv4地址已经分配完毕。可见当今互联网的发展已经达到鼎盛时期。而现在的中国的互联网更是爆炸式发展,中国
随着新型遥感数据应用的日益广泛和深入,快速而准确的提取信息已成为制约遥感应用的瓶颈,对遥感图像进行分割已成为解决这个问题的重要手段之一。基于图论的图像分割方法能够
随着移动互联网技术的发展和移动终端的不断普及,文字识别技术蓬勃发展且日趋成熟。手写输入作为移动平台上的一种高效文字录入方式,被越来越多的使用者所接受。近三十年来,
近年来通信技术、存储技术及处理器技术发展迅速,通信方式已发展成为视频音频通信方式,人们对图像质量的要求也日益升高。H.264视频编解码标准是新一代视频压缩编码国际标准,
近年来,社交网站得到了越来越多的关注,一大批社交网站如Renren、Facebook等快速崛起,这些互联网社交网站拥有庞大且日益增长的用户社群,围绕用户积累了大量的社会性数据。对