基于多Agent的协商模型及其仿真研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户：zmy_java

【摘要】

：

随着电子商务的应用以及语义网、本体论等新一代网络技术的发展，使用人工智能代替传统方式进行电子交易协商成为了研究的一个热点。传统的以人为主体的谈判达成协议的周期长，谈

【作者】

：

肖路远

【机构】

：

上海财经大学

【出处】

：

上海财经大学

【发表日期】

：

2004年期

【关键词】

：

多Agent 协商模型 Swarm仿真电子商务人工智能

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着电子商务的应用以及语义网、本体论等新一代网络技术的发展，使用人工智能代替传统方式进行电子交易协商成为了研究的一个热点。传统的以人为主体的谈判达成协议的周期长，谈判成本高，对环境变化反应速度慢，在电子市场中容易失去商机，它已经不能很好地适应全球电子商务市场发展的需要。本文在Agent技术的基础上，结合博弈论的研究以及自动协商领域现有的成果，分析了基于多Agent的协商模型的框架。在这个框架的基础上，本文结合人工智能领域的Q学习算法以及多Agent的Swarm平台，探讨和实现了具有自主学习能力的协商Agent，并通过模拟仿真验证其可行性。最后的结论显示，这样的协商模型能够具有很好的收敛性和理性。本文首先总结了学者对于协商的基本认识。学者从社会学和心理学等研究角度，得到了协商的基本内涵：冲突以及让步沟通。也就是说冲突是协商的前提，而沟通让步是协商的解决方式。另一方面，博弈论对协商的研究则分为合作博弈和非合作博弈。合作博弈的分析探讨站在整体的角度分析均衡状态下的解。本文综合探讨了这两个领域的分析。然而对于基于多Agent的研究，立足于理性个体研究探讨个体行为对于整体解的影响的非合作博弈的结论更加切合。本文结合多Agent领域研究对协商问题进行进一步的分析，本文侧重于研究多Agent协商模型的协商策略、协商协议以及Agent学习三大部分。协商策略是协商参与人Agent在协商过程中所采取的策略。各Agent偏好的差异会影响其选择不同的行为策略。各个Agent之间不同的行为互相影响有可能导致不同的协商结果。协商协议研究的是在Agent协商中各Agent的交互次序。在这点上，本文着重介绍单调让步协议。在多Agent环境中Agent个体实现其主动性和智能性的一个方式就是通过学习，这也是以前的研究所不够重视的一点。在传统的协商模型中，各Agent的策略方式是给定的，也即Agent的按照系统或者使用者预定的设置进行协商。然而，由于协商的过程其实是一个博弈的过程，协商双方所处的环境在不断变化，采用固定策略的协商一方面不能够及时调整自己的行为。本文提出了将Q学习的爬山搜索算法应用于多Agent协商的一个框架。Q学习算法是一种能够使Agent适应环境变化，调整自己策略的一个马尔科夫博弈过程。通过使用Swarm仿真平台，本文对提出的协商模型进行模拟研究，模拟侧重于Q学习算法的在协商模型的应用。本文提出了一个将相对提议距离进行离散化的一个方法，通过这样的方法，可以将连续的环境参数转化为可以用于Q学习的离散参数。并且本文结合了基于时间以及基于对方提议两种策略模型，提出了一个混合策略模型。从仿真的结果来看，本文的模型以及Q学习算法能够实现收敛以及集体理性，并且能够很好得保证协商个体的私密性。第一章引言概述了本文研究的背景，分析了研究的意义和必要性。第二章详细的介绍了与协商有关的背景知识。包括协商以及协商模型的定义，协商模型的分类，博弈论领域对于协商模型问题的研究成果以及自动协商技术的研究成果。第三章进一步提出了基于Agent协商模型。目前已有多种协商的理论、方法。本章结合多Agent技术给出了相应的协商模型、协商协议、协商策略等。在本文的最后，结合了Agent学习理论探讨了协商模型中的Agent学习算法，为后文的实现作了铺垫。第四章提出了基于Agent协商系统以及Swarm仿真平台的体系结构。这一章内容为本文的重点章节。本章结合第三章的协商模型详细得给出了其在Swarm仿真平台中的实现。作为本文的开创性研究之一，本章重点阐述了Agent的Q学习算法是如何与协商模型相结合的，以及其如何在仿真平台中进行搭建。第五章主要是针对仿真结果的分析。本章通过对模型参数的调节来分析基于协商的市场结果的变化，并且探讨形成这样变化的成因。论文的创新之处在于： 1．将隶属于强化学习的Q学习算法引入多Agent协商模型并通过Swarm仿真平台进行仿真研究。这个仿真模型其代码参见附录。 2．在协商模型中，论文提出了一个将绝对提议距离进行离散化的一个方法，并且结合了基于时间以及基于对方提议两种策略模型，提出了一个混合策略模型。 3．在仿真结果分析中，本文结合Swarm和多Agent的特性，探讨仿真结果的涌现。具体来说分析了影响协商结果的因素，基于协商的的一些市场特性等。

其他文献

浅谈边疆职业中学英语教学现状

在市场经济日益完善的健全的过程中，对人才的需求发生了巨大的变化。综合素质，实用技能，英语读写的能力等一些与生产联系紧密的要素，成了用人单位衡量人才的主要标准。因此，当前职业中学中，英语教学的地位越来越突出。然而，职业中学英语教学中的一些问题，使得中职英语教学达不到实际效果，这种现象在我们边疆职业中学中表现的尤为突出。笔者所在的学校，有80%以上的学生是彝族和哈尼族。我在学校教授英语的同时，曾在学校

期刊

边疆职业中学中职英语教学学校教市场经济日综合素质招生就业用人单位写的能力实用技能实际效果人才哈尼族彝族要素学生生产经历兼职

把家虎

制造一个半人高的电器开关铁柜,要用砂纸把里里外外磨光,有的工就是四五张。北京紫微电力设备公司喷车间主任马德勇看了非常心疼:“怎么一个铁柜子用这么多?”他捡起扔在地

期刊

旧砂纸说电力设备子用半人电器开关开关柜永定镇漆壶北京市门头沟

唐诗对日本汉诗文产生的影响

[中图分类号]：I206 [文献标识码]：A　　[文章编号]：1002-2139（2018）-32-0-02　　日本汉诗文，即日本人创作的汉诗和具有文学性的汉文。日本汉诗文是日本文学的一种样式和组成部分，是日本人民的精神财富，也是中日文化交流的重要成果。日本汉诗文兴起于公元七世纪中叶的近江时代，在开始学习西方的明治维新时代开始走向衰落。　　唐代是中国古代悠久历史上一个“前无古人，后无来者”的诗的黄

期刊

一类变系数不确定大系统的鲁棒指数控制

研究了一类系数无界的不确定大系统,首先利用分解-集结法,把大系统分解为一些孤立的子系统,给出子系统的控制输入。再综合给出大系统的控制输入。然后利用Lyapunov函数法证明

期刊