实验设计法
仪器信息网 · 2009-08-25 21:51 · 8943 次点击
又称试验设计法,数理统计学的一个分支,研究如何制定实验方案,以提高实验效率,缩小随机误差的影响,并使实验结果能有效地进行统计分析的理论与方法。其基本思想是英国统计学家R.A.费希尔提出的。他在罗萨姆斯蒂德试验站任职时着重指出:在田间实验中,由于环境条件难于严格控制,实验数据必然受到偶然因素的影响,所以一开始就得承认存在误差。这一思想是与传统的“精密科学实验”相对立的,在精密科学实验中,不是从承认误差不可避免出发,而是致力于严格控制实验条件,以探求科学规律。田间试验的目的之一是寻求高产品种,而实验时的土地条件,如土质、排水等都不能严格控制,因此,“在严格控制的这样或那样条件下,品种A比品种B多收获若干斤”这类结论,实际意义就不大。在现场进行的工业实验,医学上的药物疗效实验等,也有类似情形。这表明,费希尔首创的实验设计原则,是针对工农业以及技术科学实验而设,而不是着眼于纯理论性的科学实验。实验设计的基本思想,是减少偶然性因素的影响,使实验数据有一个合适的数学模型,以便使用方差分析的方法对数据进行分析。费希尔于1923年与W.A.梅克齐合作发表了第一个实验设计的实例,1926年提出了实验设计的基本思想,1935年出版了他的名著《实验设计法》,其中提出了实验设计应遵循三个原则:随机化,局部控制和重复。随机化的目的是使实验结果尽量避免受到主客观系统性因素的影响而呈现偏倚性;局部控制是用划分区组的方法,使区组内部条件尽可能一致;重复是为了降低随机误差的影响,以保证实验结果的重现性。费希尔最早提出的设计是随机区组法和拉丁方方法,两者都体现了上述原则。
区组设计指将υ个处理安排在b个区组内作实验的一种实验设计法。所谓“处理”,是指诸如品种、工艺条件、种植方法等因素或措施。例如,要比较三个品种的优劣,则每个品种是一个处理,共有三个处理;如试验中涉及三个品种和两种种植方法,则每个品种与每种种植方法搭配构成一个处理,一共有3×2=6个处理。每个区组能容纳的处理个数称为该区组的大小,常以k表示。若区组i的大小kj小于υ,则区组i容纳不了全部的处理,称这一类设计为不完全区组设计;当kj均不小于υ时,区组可以容纳全部处理,称这一类设计为完全区组设计。
设要比较8个不同的品种A,B,C,D,E,F,G,H,看哪一个品种产量比较高。若一个区组是一长条地块,将这个地块分成8个小块种植全部8个品种,就得一个完全区组。如共有4个这种区组,则8个品种在每个区组内的安排,要用随机化的方法,将区组内的小块编号,利用随机数或抽签方法,决定品种的位置。图1就是一个具体的随机区组设计。
如果有8个区组,每个区组可以容纳8个处理,这时不用随机化而用拉丁方进行设计,也能消除区组内各小块位置不同的影响。
拉丁方是指将υ个拉丁字母(每个字母代表一个处理)排成υ行υ列的方阵,使得各个字母在各行各列出现一次且只一次。称υ为拉丁方的阶数。例如,图2是一个5阶拉丁方。若把拉丁方的行看作区组,是一块田;把列也看作区组,是施肥量;那么拉丁方设计不但能消除行内各小块位置不同的影响,还能可以消除列内施肥量不同的影响。
不完全区组设计在实际中常常遇到。一个区组可以是一块地、一辆汽车的四个轮胎或是车间的一个班组。当处理的数目太大时,要将全部处理安排在一个区组内是有困难的,因为区组的规模太大,就不能保证区组内的均匀性。
费希尔的合作者F.耶茨提出:将全部处理分成若干组,每组形成一个区组,使区组大小缩小以保证区组内的均匀性。由于各个区组不包含全部处理,这种设计叫不完全区组设计。一般地,区组设计的狭义理解大都指不完全区组设计。
不完全区组设计主要有两类:一类是平衡不完全区组(BIB)设计,一类是部分平衡不完全区组(PBIB)设计。设b)个区组大小相等,均为k,且k