编者注:本文是系列文章的第14部分;有关上一期文章,请参阅PCI, 2007年3月。

在之前的文章中,1,2阶乘设计被描述为特别适合于研究连续变量,如压力、温度、时间和速度,以及分类变量,如化学功能类型、批号和位置。混合物设计被描述为特别适合于研究添加到1或100%的变量,如共混物、配方、反应、低聚物和聚合物。

我有一个拥有应用统计学博士学位的同事,他总是尽可能地支持实验设计,但从未使用过混合统计学。当需要进行混合设计时,他会让他的客户来找我。在他认识我之前(甚至在他认为自己可以侥幸逃脱的时候),每当他要研究一种混合物时,他都会使用松弛变量、阶乘设计。

本文讨论松弛变量、阶乘设计和混合设计之间的区别。

因子设计

要研究的配方含有三种成分。通过初步评估,研究人员发现每种成分应限制在0.3至0.4之间,以获得可用的配方。这可以用下面的符号来描述:

0.30≤a≤0.40
0.30≤b≤0.40
0.30≤c≤0.40

如果要使用标准的阶乘设计,则每个变量的低水平(编码为-1)将设置为0.30,高水平(编码为+1)将设置为0.40。表1以标准顺序给出了这种类型的三因素阶乘设计。包括中心点实验和二次系数估计实验。A、B和C的第一列以编码形式显示;A、B和C的第二列显示了成分的实际水平;A、B和C的第三列显示了成分的标准化水平。

水平必须标准化,因为在几个实验中,几个成分的总和不等于1。所有成分的总和是1。实验1、11、13和15的成分总数小于1。实验4、6、7、8、10、12和14的成分总数大于1。

现在又出现了新的问题。在实验归一化到1之后,第一个问题是几个实验的成分归一化水平低于期望的0.3。

另一个问题是,使用-1、-1、-1编码的实验1与使用+1、+1、+1编码的实验8和使用0,0,0编码的实验9具有相同的归一化水平。这阻碍了任何有意义的数学分析。



松弛变量,阶乘设计

解决这个问题的一种方法是在双因素阶乘设计中只使用两种成分。第三个因素被称为松弛变量。在这个例子中,A和B是阶乘变量,C是松弛变量。首先,设置A和B的级别,然后将C设置为使A + B + C = 1所需的任何值。表2列出了这一点。

一个问题是C变量落在期望的实验范围之外。这是松弛的阶乘设计的产物。希望碳浓度低至0.2的配方仍然有效。否则,实验4、6和8将无法获得数据,也就无法进行响应面分析。



星号点通常位于每种成分的-1.4和+1.4的设计范围之外。然而,星点水平被调整为-1和+1,因为设计不大于0.3到0.4的范围。设计空间和设计点如图1所示。

假设研究人员拥有所有实验的数据,当使用表2的实验对二次回归方程进行析因设计时,方程将有以下形式。
属性= b0 + bAA + bBB + bABAB + bAAA2 + bBBB2 (1)



如果所有的系数都是显著的,人们可以这样解释它们,例如,当A发生变化时,属性变化了aAA个单位和aAAA2个单位。类似地,当B发生变化时,属性会按aBB单位和aBBB2单位变化。当然,当A或B发生变化时,我们也会看到相互作用项AB的贡献发生变化。看起来缺少的是C的贡献,因为它也在变化。没有经验的研究人员可能会忽略C的贡献或认为它不存在。C的影响隐藏在b系数中,但后面会有更多。

由表2的松弛阶乘设计数据生成的响应面如图2所示。该图可用于预测会给出特定结果的公式。例如,当a = 0.35和B = 0.40时,一个公式会给出90的值。那么C就必须设为0.25。

混合设计

另一种方法是使用混合设计来研究配方。在A + B + C = 1的条件下,再次使用上述公式范围。

定义二次数学混合模型所需的实验如表3所示。(我使用了与松弛的阶乘设计相同的响应方程来计算属性,以便稍后进行比较。)



图3显示了设计点和设计限制。图3中的设计空间比它应该的要大,以便稍后可以将混合设计空间与松弛的阶乘设计空间进行比较。

当对混合料设计的回归方程进行分析时,它将有以下形式。
属性= aAA + aBB + aCC + aABAB + aACAC + aBCBC (2)

如果所有的系数都是显著的,人们可以这样解释它们,例如,当A增加时,属性增加了aAA个单位。当然,当A增加时,B或C或两者都减少,那么属性将因aBB和/或aCC的变化而改变。人们还会看到相互作用项AB、AC和BC的贡献发生了变化。关于增加B或C的意见也类似。



混合料设计的响应面如图4所示。

等一下!这个响应面只有大约45到70之间的属性变化。宽松的阶乘设计的性能在45到140之间变化。让我们看看在松弛的阶乘设计中发生了什么。



松弛方程的解释

图1的松弛阶乘设计空间可以按照图5所示的混合坐标重新绘制。设计空间是期望设计空间的两倍大。灰色区域是在松弛析因设计中使用不受控制的松弛变量C所引入的额外设计空间。虽然C的理想范围是0.3到0.4,但由于A和B的最大范围都达到了0.4,C不得不降低到0.2。灰色区域中的公式可能有效,也可能不理想。



如果实验成功,响应面如图6所示。属性范围从45到140,如图2所示。

混合料设计响应方程如式2所示。如前所述,下列等式成立:
A + b + c = 1 (3)

式3可以重新排列为:
C = 1 - a - b (4)

将式2中的C替换为式4,可得松弛方程:
属性= aC + (aA - aC + aAC)A + (aB - aC + aBC)B + (aAB - aAC - aBC) aB - aACA2 - aBCB2 (5)

如果我们将公式5与公式1进行比较,我们可以看到:
b0 = aC (6a)
bA = (aA - aC + aAC) (6b)
bB = (aB - aC + aBC) (6c)
bAA = - aAC (6d)
bBB = - aBC (6e)


公式6a到6e表明,C对性能的影响包含在b0, bA, bB, bAA和bBB系数中。这意味着方程1和2是等价的。也就是说,方程1的响应面图与方程2的响应面图是等价的。

在过去,当一个不成熟的研究人员从一个松散的实验设计中查看方差表分析时,如果变量a显示出显著的影响,研究人员会将这种影响归因于a的变化,表现为bA系数的大小。但是,从公式6b来看,如果bA系数显著,研究者不知道这是由于变量A、变量C的影响,还是由于它们的相互作用AC的影响。同样,对于B变量,如果bB系数显著,研究者不知道这是由于变量B、变量C的影响,还是由于它们的相互作用BC的影响。然而,研究人员可以通过查看b0, bAA和bBB的系数来了解C, AC和BC的影响大小。然后研究人员可以做一些心理体操来确定C、AC和BC对A或b的影响有多大。在我看来,使用方程2的混合方程更容易。



关闭评论

我唯一推荐使用宽松的阶乘设计的情况是,如果完全知道C对属性没有影响。也就是说,如果研究人员事先知道aC, aAC和aBC都是零。

我喜欢混合设计的另一个原因是,即使对于简单的三种成分的例子,二次混合设计比二次松弛的阶乘设计有更少的实验。然而,如果要研究五种成分,例如二次混合模型只需15次实验加上重复和缺乏拟合点,而二次松弛阶乘模型需要51次实验。