医学数据统计分析中MCMC算法的实现与应用

来源 :第四军医大学 | 被引量 : 13次 | 上传用户:tiger0092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算问题是Bayes统计学发展和得以普及应用的命脉,而MCMC技术是解决这一问题的利器,对MCMC及其相关算法的研究有助于Bayes方法在实践中更为广泛的应用。 目前虽然在Bayes理论框架下国外学者对MCMC已有大量研究并提出了诸多算法,但实际上真正易于在计算机上实现的方法并不多,因此本课题致力于MCMC方法的具体实现的研究,这一实现体现在计算的自动化方面。在对MCMC方法的基本理论及其算法研究的基础上,本研究运用计算机随机模拟的原理和方法,采用面向对象的编程技术,对如何编程实现MCMC算法以及如何将其应用到统计学模型上进行了理论和实践探索。 通过理论研究及实践总结,对如何实现Gibbs抽样算法的基本思路归纳如下:首先根据实际问题确定统计学模型并选取各个参数的先验分布,然后依据模型构建出DAG图模型中各个节点(参数)之间的父子关系,在此关系上构造各待估参数的完全条件分布,最后应用适应性舍选抽样算法(ARS)对各参数进行随机抽样,循环此抽样过程直到取得了足够多的样本用于估计。依 第四军医大学硕士学位论文据此实现思路,用Delphi编制出了一系列对象及函数,初步实现了Gibbs抽样算法,构建了一个便于持续开发的软件环境并将计算软件暂命名为ARSP。在此软件环境下,后来的开发者仅需书写定义变量和为变量进行赋值的代码语句即可实现对一个新的统计模型的计算,依据随机变量的父子关系,系统能够自动计算其完全条件分布,在此过程中开发者完全不用考虑此计算的任何实现细节。要进一步扩展开发环境,开发者只需定义新的分布类型,具体要做的就是定义此分布的参数及密度函数的计算公式。目前在开发环境中己定义了均匀分布、二项分布、泊松分布、正态分布、伽玛分布、贝塔分布、t分布和帕莱托分布:计算结果包括描述性统计量:均数、中位数、标准差、四分位数、95%Cl、峰度系数、偏度系数:统计图有直方图(用于描述参数的后验分布)和踪迹图(用于参数模拟收敛性的诊断)。要对模拟的Markov链进行更深入的分析,用户可将中间结果以多种文件格式导出到外部文件,这些文件可以被多数统计软件读取。此外,本系统较WinBUGS提供了更为丰富的数据接口,包括dBASE、Paradox、MSAeeess、MS Exeel和TXT格式的数据,这使得数据采集范围更加广泛,对数据的输入编辑以及核查校验更为方便。本软件采用Windows风格界面,支持鼠标操作,通过菜单、按钮、文本框等与用户交互,目前已形成基本的界面框架。 在此环境下,ARSP可完成对下列统计问题的建模和模拟计算:描述性统计量、一元及多元线性回归、有随机效应的Logisti。 第四军医大学硕士学位论文回归、方差分量模型、正态分层模型、交叉设计的生物等效性检验、Poisson模型、Meta分析等,绝大部分结果可与WinBUGS软件的计算结果相互验证。目前,ARSP的限制在于只适应于广义线型模型的计算,不足之处是计算效率较WinBUGS低,计算结果尚存在一些偏差,软件的用户界面也还有待进一步完善。 文中还探讨了一些应用MCMC和提高MCMC算法性能的问题,如迭代次数、收敛性诊断以及重新参数化等。 总之,通过本研究初步总结出了编程实现MCMC方法的思路,该思想经过实践验证总体上是可行的且易于在计算机上实现。据此开发的软件ARSP运行基本稳定,程序易于扩展,具备良好的可持续开发的特性。
其他文献
由于今年降水量充足,病虫害少,黑龙江省无公害秋菜喜获丰收,白菜、土豆、大葱等蔬菜更是备受南方客商的青昧。
一、选择适合露地栽培的菌种要选择低温型、发菌快、抗逆性强、适应性广的菌株,即云香241、04等。
本文通过研究群体性事件发生的心理学动因,建立了一种新的心理学模型,该模型对研究群体性事件发生发展的规律具有重要的作用。
近两年来统一战线发展中的一项新事物,就是统战工作日渐向农村基层延伸,全国各地相继出现农村基层政协组织,多数地方把它称为乡(镇)政协工作组。这种组织在江西已经建立1121个,占全
针对目前植物学实验教学模式中存在的普遍问题,从培养和提高学生综合分析解决实际问题和自主创新能力出发,讨论了植物学实验的基础验证性实验、综合性实验和设计性实验的教学
在以往的美术区域活动中,存在着追求美观而忽视教育功能的形式主义,存在着教师动手动脑多、幼儿动手动脑少等问题。由于这种美术区域创设是从成人的角度出发的,很少考虑到幼儿的兴趣、需要和现有发展水平,因而降低了幼儿对区域探究的动力。那么在区域中,什么样的任务才能更好地驱动大班幼儿主动探究?如何使区域探究活动更持续、更有挑战性,使幼儿的学习品质得到更好的发展?基于以上问题,我园教师开展了基于任务驱动的大班探
阐述医学研究中常见行列表资料的类型、构建及其统计分析的目的,并以实例说明其统计分析的方法和途径。
随着我国经济的飞速发展,人们的生活水平也在随之提升,这也使能源的消耗也越来越大,因此,节能措施越来越得到人们的重视,土木工程建筑也不例外,在给人们提供舒适的办公和居住
针对煤矿井下综采工作面环境恶劣、液压支架数量多以及现有国产液压支架电液控制系统通信可靠性低、实时性差等问题,提出了一种基于DSP和多条RS485总线的液压支架电液控制通
期刊