论文部分内容阅读
决策就是从一个备选方案集中选择出若干个个体或群体偏好的方案。当面对复杂的决策问题时,单个决策者仅凭自身的经验和智慧往往难以做出最优或科学的决策,存在诸多不足。通过对多个个体偏好的集结,汇集更多的信息,能有效减少个体决策带来的风险或偏见。因此,相比于个体,群体决策有时具有一定的合理性和科学性,群决策也是迄今决策理论研究的一个主要领域。跨期重复选择是一个多阶段的动态群决策问题,即随着决策阶段的演变,决策个体、备选方案集或群体的偏好等每期都可能发生变化,这些因素的变化往往使得整个决策看起来更加复杂。虽然群体中个体的偏好会随决策阶段而变化,并且群体的长期社会福利、个体的长期收益以及群决策的各期结果紧密相关,但是这类看似复杂的跨期重复选择问题有时表现出一定的马氏性。本文对此建立了一个马尔科夫动态决策规划模型,旨在为某些跨期重复选择或复杂群决策问题提供一个分析和求解工具。但是,直接求解一般马氏决策模型的最优策略往往面临状态空间过大而难以操作或计算的困难。文中,我们针对一种典型的跨期重复选择问题,利用个体间偏好变化的对称性降低了模型求解的时间复杂度,并说明了这种简化方式的可行性和实用性。三人三方案的群体投票选择可能会产生Condorcet循环,但是跨期重复选择从个体长期收益的角度考虑可以避免该循环的出现、并选出唯一的获胜者。本文采用基于个体期望收益最大化的无限阶段马氏决策折扣模型,在个体偏好完全或不完全披露、以及考虑长期收益的条件下,研究了理性个体采用混合(平稳)策略情况下Condorcet胜者或循环的存在性,分析和求解了该混合策略,并结合博弈行为探讨了不同信息结构下个体决策者间披露各自偏好信息的可能性及群决策结果。最后,本文列举了一个现实的政治选举例子,结合理论研究结论分析和解释其中的一些博弈现象,以说明我们研究成果的理论和应用价值。