若干计算机试验设计的构造与分析

来源 :南开大学 | 被引量 : 0次 | 上传用户:kkhaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
试验设计是统计学的重要分支之一,它在统计学的课程、研究和应用中扮演着关键角色。试验设计不仅拥有完整的理论体系,它在我们日常生活实践中也有着广泛的应用。试验有助于我们了解某些过程或系统的机制,掌握更多关于产品的信息,以进一步提高生产效率。试验包括两个方面:设计和分析。试验的设计艺术和分析技巧有着紧密联系。前者的目的是希望通过精心设计试验以提高后者的效率和精度。试验的分析指的就是统计推断,它包括建模、变量选择、估计、预测、优化等等。一个好的设计应该利用尽可能少的资源去获得关于研究对象的尽可能多的有用信息。  试验又可以分为两大类:实体试验和计算机试验。实体试验是指那些在实验室、工厂或田问完成的试验。试验设计的发展可以追溯到二十世纪三十年代,统计学家R.A.Fisher在英国的一问农场试验站开始了他的开创性工作。实体试验的特点是试验结果会受到系统误差的影响。系统误差客观存在且不可控,所以在相同的因子水平设置下去多次重复试验会得到不同的结果。随机化、分区组和重复是实体试验的三大基本原则,它们可以降低系统误差的影响。计算机试验的兴起得益于近几十年来计算机技术的迅猛发展。与实体试验相比,计算机试验通过在计算机上运行代码来完成。因此,计算机试验的输出结果具有确定性,这也是计算机试验与实体试验的最大区别。实体试验中的三大基本原则不再适用于计算机试验。除了输出具有确定性,试验代码的运行也可能会花费大量的时间。计算机试验的另一特点就是包含的输入变量数目众多-15到20或者更多。计算机试验的目的就是建立一个拟模型,通过这个拟模型来刻画输出变量和输入变量之间的复杂关系。根据计算机试验的特点,我们需要新的设计和分析方法来与之对应。  计算机试验的发展才刚刚起步,对许多问题的研究还不是很完善。该领域中有许多新的有意义的课题值得研究者们深入研究。本文研究计算机试验中的一些新课题,包括二阶正交分片拉丁超立方体设计的构造和基于近似正交表的拉丁超立方体设计的构造。此外,本文还提出了一类新的设计一半拉丁超立方体设计,并将其应用于计算机试验的分析中。  拉丁超立方体设计是由McKav等人在1979年提出的。它是计算机试验中最为常用的一类设计。拉丁超立方体设计可以在任意一维上达到最大分层,这一特性使得它可以很好地适应计算机试验输出结果具有确定性这一特点。拉丁超立方体设计早期的构造都是各列独立构造,这就会使得因子之间可能会具有较强的相关性。而较强相关性的出现会导致严重的共线性,且不利于显著因子的识别,使后续的数据分析变得复杂。在回归分析中,如果变量之间相互正交,那么就可以保证系数的估计之间是不相关的。如果设计具有正交性,那么主效应估计之间是不相关的,这就有助于识别重要因子。进一步,如果设计具有二阶正交性,那么除了主效应估计之间不相关,所有主效应估计与二次效应估计、主效应估计与二阶交互效应估计之间都是不相关的。这就可以排除二次效应和二阶交互效应对主效应估计的影响。因此,构造具有正交性或二阶正交性的拉丁超立方体设计是计算机试验中的一个热门课题。  计算机试验可以看成是一个黑盒子,由于我们对这个黑盒子中的信息了解得非常有限,一个很自然的想法是尽可能详尽地对试验区域进行探索。带有空间填充性的设计可以将设计点尽量均匀地布置在设计区域上。如何使拉丁超立方体设计具有空间填充性是一个有趣的问题。正交表、近似正交表和强正交表是构造带有空间填充性的拉丁超立方体设计的基石。基于此构造出的设计在较低维上会具有分层性质。由于试验次数相对有限,较高维上的分层性质还是难以达到的。本文给出了一种利用正交表构造近似正交表,进而构造带有低维分层性等优良性质的拉丁超立方体设计的方法。另外,基于某些准则优化得来的设计也可能具有空间填充性。距离准则,例如最大最小距离和最小最大距离(Johnson,Moore and Ylvisaker,1990),还有均匀性的一些准则,例如中心化L2偏差和可卷L2偏差(Hickernell,1998a,1998b),都可以帮助我们找到好的设计。  在实际中,计算机试验可能既包含定量因子又包含定性因子。Qian(2012)提出的分片拉丁超立方体设计适用于这类试验,该设计的每一个分片可以对应于定性因子的一个水平组合。分片拉丁超立方体设计不仅适用于带有定性定量因子的计算机试验,也可以用于多精度计算机试验、模型校正、交叉验证、多水平函数估计、随机优化、数据汇集等等。如何使分片拉丁超立方体设计具有正交性、近似正交性和分层性质是值得研究的问题。本文给出了一种构造二阶正交分片拉丁超立方体设计的方法,相比于现有的设计,本文构造的设计在参数上更为灵活,性质更加优良。  对于计算机试验的分析,预测精度是一个很重要的关注点。从试验设计的角度看,一个精心安排的设计能够为提高预测精度提供帮助。此外,由于系统的表现在变量的临界值附近可能会变得不稳定,在试验区域边界附近进行预测要比在中心点附近进行预测难得多。如何通过安排设计使得在整个试验区域上都有较优的预测精度是一个值得关注的问题。关于这个问题,本文给出了一些初步的研究和探索。  下面简要介绍一下本文各章的基本内容。  第一章是引言,简要介绍了一些背景知识。  第二章给出了一种构造二阶正交分片拉丁超立方体设计的方法。分片拉丁超立方体设计可以应用于计算机试验的多种情形。正交性和二阶正交性对于识别重要因子非常关键。除了正交性,空间填充性对于拉丁超立方体设计来说也是一种优良的性质。本章给出了二阶正交分片拉丁超立方体设计的构造方法,并对构造出的设计进行优化,使其具有良好的空间填充性。进一步,本章将构造方法推广到了构造近似正交分片拉丁超立方体设计。对于本章给出的设计,其分片数、列数和因子水平设置相比于现有同类设计都更为灵活。  第三章提出了基于近似正交表构造拉丁超立方体设计的方法。低维分层性对于拉丁超立方体设计来说是一个极好的性质。为了满足实际需要,计算机试验的设计需要可以容纳数量较多的因子。本章构造了一类拉丁超立方体设计,这类设计的列可以分成若干个组,来自不同组的任意两列都具有分层性质,同组的列之间具有列正交性或空间填充性。此外,我们将这种构造方法推广到了构造具有上述性质的分片拉丁超立方体设计。与现有设计相比较,本章给出的设计可以容纳更多的因子,并可以对试验区域进行更为详尽的探索,且具有优良的性质。  第四章构造了一类新的设计一半拉丁超立方体设计,并展示了其在计算机试验分析中的优越性。从试验设计的角度看,设计会对预测精度产生影响。本章提出了一类新的设计一半拉丁超立方体设计,这类设计包含一个内嵌的拉丁超立方体设计,并在试验区域的边界附近额外添加了一些设计点。因此,该类设计不仅保持了拉丁超立方体设计的空间填充性,还为在试验区域边界进行预测提供了帮助。本章通过几个模拟例子比较了半拉丁超立方体设计和拉丁超立方体设计。除了给出构造方法,本章也给出了一个为设计序贯添加试验点的算法,以便进行序贯试验。随后,将半拉丁超立方体设计运用到带有函数响应的计算机试验中,以显示其在某些方面的优良性质。  第五章对本文的工作进行了总结和讨论。
其他文献
《伦勃朗1642》  出版社:译林出版社  张佳玮ZhangJiawei作者  从著名的《夜巡》入手  描摹生动的荷兰黄金时代市民生活  再现不为人知的欧陆绘画传统  复原光影
徐为零印选徐为零号甲湖村民、扫雨堂主。一九六八年生,江苏淮安人,中国民主同盟盟员、中国书法家协会会员、江苏省青年篆刻展评委、淮安书画院专职书法家兼展览部主任。杨国
期刊
分屑和修磨横刃是提高钻孔效率的有效方法。在总结了国内外几种先进钻型的基础上 ,提出了新型高效的钻头刃形。通过试验 ,证明了这种新钻型优越的钻削性能 ,并可以在生产中广
期刊
随着教学改革的不断深化,现阶段的中学历史教学是一个集知识教学、思想教育、能力培养于一体的系统过程.本文中主要介绍了历史教学中要做到知识和能力双丰收.
提高中学生英语口语能力,是中学英语教学亟待解决的问题和首要任务,要提高学生的口语能力,首先要鼓励学生在各种场合敢于大胆地说英语.其次要改善教学环境,强化听说训练.在培
2013年7月21日,星期天,又是一个“高温艳阳天”.rn长沙继续进入“烧烤模式”.不过几十天都是这样“煎熬”过来的,早已练成了水火不侵的“金身”.rn尽管酷热难耐,但区域安全生
随着新课程标准的出台,初中语文课程从其课程的设置、学生的学习方法以及培养目标等方面都要求进行改革,以全新的教育理念进行讲学授课.本文对新课程标准提出的关于初中语文
一、选题背景及意义金融衍生工具产生于20世纪70年代,发展于80年代,盛行于90年代。目前,全世界共有50多个交易所可进行衍生工具交易,以金融期权为主的金融衍生工具已发展到了数十