论文部分内容阅读
在许多科学研究或工业试验中人们通常会同时研究两个或两个以上的输入变量对试验结果的影响。因析试验(factorial experiment)是研究这类问题最常用的工具。这些输入变量称为因子,输入变量的可能取值称为因子水平。
本人积极参与了由导师所开创的这一新理论的研究工作,特别研究了一些计算AENP和寻找GMC最优设计的方法。在第2章我们首先介绍了文章Zhang,Li, Zhao and Ai(2007)的理论工作,然后在此基础上给出了计算AENP和搜索GMC最优设计的普通方法。这个方法虽然非常易于理解和应用,但是需要计算定义对照子群和所有的陪集,所以当生成因子较多时就不适用了。因此本文在因子混杂结构矩阵和因子混杂结构字型的基础上给出了搜索GMC最优设计的顺次算法。这个方法避免了计算定义对照子群和所有的陪集,所以当生成因子个数比较多时可以极大地节省计算AENP的时间。这一方法也利用GMC最优设计的性质极大地缩小了搜索的范围,显著地节省了搜索最优设计的时间。我们应用此方法得到了大量的GMC最优设计,并在第2章附录中列出了32个run和64个run所有的GMC最优设计以及MA最优设计。区组设计在科学试验中应用非常广泛,通过分区组可以减小试验的误差,提高估计的精度。如何找到一个好的分区组方案是一个非常重要的问题。很多分区组的准则和区组设计的构造方法都是基于MA准则和纯净准则的。与不分区组的情况类似,基于MA准则的各种最优分区组准则也存在一些问题。最近的文章Zhang,Wei and Li(2008)把GMC理论推广到分区组情形,并且圆满地回答了这些问题。在第3章开始我们介绍了该文的主要结果。在以前的文献中人们认为区组因子的各阶效应是显著的。所以在考虑设计时都要保证区组因子之间是相互独立的。该文根据实际问题的需要首次明确提出把分区组的情况分为两类。一类是传统的,把试验单元以非齐性分成2r个区组,而把这2r个区组看成由r个两水平区组因子生成的。而各阶区组因子效应认为都足同等显著的。另外一类是,一共有r个两水平区组因子,每个区组因子代表不同的实际含义。这时候各阶的区组因子都有明确的含义,而且不同阶的区组因子重要性不同。Wu and Hamada(2000)提到过这个想法,但是没有把这两种分区组情况分开看待,也没有给出进一步论述。对于第二种分区组情况,可以象处理因子那样看待,三阶及以上的区组效应可以忽略不计。首先把所有的处理因子效应按照其所在的不同陪集分成四类:g-类、b-类、m-类和φ-类分别表示出现在包含总均值的陪集(即定义对照子群)、包含不可忽略的区组效应的陪集、包含主效应的陪集和其它陪集的处理因子效应集合。然后根据各个集合内不同处理因子效应之间的混杂关系,定义了分区组情况下的混杂个数型,即BAP。针对两种不同的分区组情况.给出了相应的分区组的一般最小低阶混杂准则,即B1-GMC和B2-GMC。证明了在第一种分区组情况下,基于MA准则的四种准则的字型也是BAP的某个函数。也清楚地找到了已有各个准则下最优设计很多情况下会出现矛盾的原因。同时证明了第二种分区组情况下,B2-GMC最优设计所具有的优良性质。怎样找到两种分区组情况下的最优设计也是一个很重要的问题。我们在第3章也给出了分区组情况下的因子混杂结构矩阵和因子混杂结构字型。并在此基础上给出了搜索B1-GMC和B2-GMC最优设计的顺次算法。这一方法同样极大地简化了计算BAP,而且生成因子个数比较多时同样适用。并且利用B1-GMC和B2-GMC最优设计的构造性质缩小搜索的范围。本章附录中列出了32个run的B1-GMC和B2-GMC最优的设计,以及基于MA的四种准则的最优设计。当试验中某些因子的水平不容易改变,或者改变水平的成本非常高时,人们通常会使用裂区设计。在裂区设计中水平不容易改变的因子称为整区因子,记为WP因子;而水平相对容易改变的因子称为子区因子,记为SP因子。在实施裂区设计时,我们首先在WP因子的水平组合中随机挑选一个,然后在其固定的情况下,随机地选择SP因子的水平组合。只包含WP因子的效应称为WP型效应,其它效应称为SP型效应。部分因析裂区(FFSP)设计可以通过定义字得到。FFSP设计的设计阵和普通的部分因析设计的设计阵形式上完全相同。Huang et al. (1998)把最小低阶混杂的概念推广到FFSP设计中用来寻找最优的FFSP设计。由于没有考虑WP因子和SP因子之间不能交换,所以仅利用最小低阶混杂准则还不足以找到好的FFSP设计。Bingham and Sitter(2001)建议在最小低阶混杂设计中寻找能够使得B1=0并且B2达到最小的设计,这里Bi表示和WP因子混杂的i-阶SP因子的个数。Mukerjee and Fang(2002)在此基础上提出了最小二阶混杂(minimum secondary aberration])(AISA).Kulahci et al.(2006)明确指出最小低阶混杂作为FFSP设计的设计准则存在某种缺陷,并对裂区设计提出一个纯净两因子交互效应个数最大的设计准则的改进形式。Yang,Li,Liu and Zhang(2006)把FFSP设计的两因子交互效应分成了三类,分别是:WP2fi、SP2fi和WS2fi。并且研究了FFSP设计存在纯净效应的充分必要条件。Zi,Zhang and Liu(2006)给出了FFSP设计包含的纯净两因子交互效应最大个数的界。在第4章我们把一般最小低阶混杂思想推广到了FFSP设计中。首先把所有的效应按照其所在的混杂陪集分成了三类,分别为g-类、ω-类、s-类。其中g-类表示该因子所在的集合包含总均值,即定义对照子群;ω-类表示该因子所在的集合包含WP型效应;s-类表示该因子所在的集合只包含SP型效应。在这个分类的基础上,定义了FFSP设计的的混杂效应个数型(SPAP)。基于效应排序原则和SPAP,我们给出了裂区设计下的一般最小低阶混杂准则,即SPGMC准则。最小低阶混杂准则、最小二阶混杂准则和纯净效应准则都可以看作最优化SPAP的某个函数。对于2(n1+n2)-(k1+k2)裂区设计,令p1=n1-k1,p2=n2-k2,p=p1+p2=(n1+n2)-(k1+k2)。如果n1≤2p1-1并且n2≤2p-1-2p1-1,则SPGMC最优设计所有主效应都纯净,而且使得纯净两因子交互效应的个数达到最多,并且在此基础上顺次最大化纯净的不与WP型效应混杂的SP型两因子交互效应、纯净的WP型两因子交互效应和纯净的与WP型效应混杂的SP型两因子交互效应。根据实际问题的需要,也可以通过重新组合或者排列SPAP得到新的最优准则。超饱和设计在工业中有非常广泛的应用,因为这种设计可以有效地减少试验次数降低试验成本。由于试验次数不能满足估计所有的主效应,所以超饱和设计的数据分析是一个很复杂的问题。近年来研究者提出了一系列分析此类数据的方法。比如Chipman,Hamada and Wu(1997)提出了一种贝叶斯分析方法;Beat-tie,Fong and Lin(2002)提出了一种两阶段的贝叶斯分析方法;Li and Lin(2002,2003)给出了一种带惩罚项的最小二乘法;Lu and Wu(2004)提出了分阶段法;Zhang,Zhang and Liu(2007)提出了基于偏最小二乘的分析方法。第5章介绍了一种对照正交聚类方法,通过这个方法可以比较全面地描述因子之间的混杂关系,并且可以指导实验者更加科学地安排因子。在对照正交聚类方法的基础上提出了一种数据分析方法,称为对照正交聚类分析方法(contrast-orthogonality clusteranalysis)(COCA)。通过模拟结果和实际例子证明COCA方法非常有效。另外,由于COCA方法主要利用聚类方法和逐步回归方法,所以在实际中非常易于理解和使用,在第6章总结了文章的一些主要结论,同时提出了几个值得进一步研究的问题。