Run 1 2 3 4 5 6 7 8 A -1 1 -1 1 -1 1 -1 1 B -1 -1 1 1 -1 -1 1 1 C -1 -1 -1 -1 1 1 1 1 D -1 1 1 -1 1 -1 -1 1 AB 1 -1 -1 1 1 -1 -1 1 AC 1 -1 1 -1 -1 1 -1 1 BC 1 1 -1 -1 -1 -1 1 1 ABC(=D) -1 1 1 -1 1 -1 -1 1 聪明的读者一定会猜到还可以使用图二的计划表继续构建出第5、第6乃至第7个因子,但试验的规模依然保留在8次。当然
等规模的试验中所涉及的因子数量越多时,产生“混杂”的概率会越大,后期分析结果的精确程度也会有所降低。这就是试验成本逐一推算,成熟的六西格玛统计分析软件JMP早已能够自动地实现了这一功能。 下面我们想通过一个发生在国外的DOE案例来体会部分因子设计的实际意义。
析精度这对矛盾的平衡,也是“部分因子设计”产生的基本原理。值得一提的是,在制定部分因子设计的具体方案时,不必如此繁
场景 : ACB公司是一家网络公司,主要为个人用户提供服务。近阶段以来公司网站的点击数总体偏低,排名在同行业中持续高层管理层决定通过一个DOE项目找到少数几个关键因素,提高公司网站的每周访问量。经过初步分析,项目团队发现关键词的个关键词的类型、URL标题、每周的更新频率、关键词在标题中的位置和免费礼物是最具可能性的关键因子。但是如果按传统的完全计的思路,至少要做26=64次试验,项目的时间跨度超过一年,分析结果的价值性大大降低,有什么好办法来克服这个困难呢?
显然,这个案例用部分因子设计的DOE来实现是再合适不过了。针对已知的6个关键因子,各取两个最具代表性的水平值,鉴量,结果如表四所示。 表四 DOE实施记录
每周的更新频关键词在标题中的URL标题 关键词的个数 关键词的类型 率 位置 短 长 短 长 短 长 短 长 项目的主要目的是寻找关键因子,选择筛选效率最高的设计方案26-3(=8),不同水平组合时分别运行1周,八周后统计相应的
免费礼物 有 有 无 无 无 无 有 有 点击数 5083 2272 2012 4328 6359 3676 4779 6549 5 5 10 10 5 5 10 10 旧 旧 旧 旧 新 新 新 新 4 1 1 4 4 1 1 4 第70个字符 第40个字符 第70个字符 第40个字符 第40个字符 第70个字符 第40个字符 第70个字符 接着,专业六西格玛统计分析软件JMP可以帮助我们做出具体的定性和定量的分析,不仅如此,它还等借助丰富生动的图形甚画将分析结果展现给我们。在此笔者不想强调过多的统计概念,只想用形象直观的图形说明分析结果。 图一 主因子作用的Pareto图
图二 主因子作用的正态性图
无论是从图一的Pareto图,还是从图二的正态性图,我们都能清晰地发现每周的更新频率和关键词的类型是影响点击数的关键子DOE的魅力正吸引着更多的工作人员将DOE的分析方法应用到更多的应用领域中。
由此可见,在部分因子设计的思想指引下,多因子试验的时间成本、经济成本大大减少,而主要的分析目的没有受到丝毫的影响,
用DOE方法最优化质量因子配置
经过筛选试验的精简和全因子试验的描述,很多人会满足已经取得的成绩,但也有一些精益求精的人会提出这样的问题:
设置中最理想的选择吗?如果不是,又应当如何找出最优化的因子设置?确实,以往的DOE侧重于分析哪些因子是重要的,到
却没有刻意去从整体中寻觅最佳的因子设置。为了解决这个问题,需要引入DOE中另一种新方法——(Response Surface Met的中英文双语版六西格玛软件,来自全球顶尖的统计学软件集团SAS。
系列介绍的主题。在这里,笔者仍将借助目前业界公认的高端六西格玛统计分析软件JMP来为大家展现响应曲面方法的实现和
在实际工作中,常常需要研究响应变量究竟如何依赖于自变量X的,进而能找到自变量的设置使得响应变量得到最佳值
则响应曲面方法是最值得推荐的方法,适合于要求响应变量望大(即越大越好)、望小(即越小越好)和望目(即越接近目标
通常来说,DOE的核心技术可分为试验计划和数据分析两大类,响应曲面方法也不例外。在数据分析方面,它和以前介绍
划方面,则有显著的改进。响应曲面方法的试验计划主要有中心复合设计和Box-Behnken设计两种形式,具体用图形说明如下图一 三因子中心复合设计布点示意图
1. 立方体点(Cube Point),用蓝色点表示。各点坐标皆为1或-1, 这是全因子试验相同的部分。 2. 中心点 (Center Point),用绿色点表示。各点的三维坐标皆为0。
3. 轴点(Axial Point),用黄色点表示。除了一维自变量坐标为±a(旋转性指数)外,其余维度的自变量坐标皆为0。 试验计划的另一种形式就是Box-Behnken设计。这种设计的特点是将因子各试验点取在立方体每条边的中点上。 图二 三因子布点示意图
图二同样以三维空间立方体的形式展示了一个三个因子的Box-Behnken设计的试验计划示意图。整个试验由下面两部分试2. 中心点 (Center Point),用黑色点表示。各点的三维坐标皆为0。 优区域的确定等提供了极大的便利。
1. 边中心点(Side Center Point),用白色点表示。除了一维自变量坐标为0外,其余维度的自变量坐标皆为±1。 在三个
由以上两个示意图可以清晰地发现,响应曲面方法有规律、有目的地在试验计划中增添了有限次数的各因子的中心试验点和拓
关于响应曲面方法在数据分析方面的特点,由于其和一般的因子设计DOE非常类似,此处就不做赘述。主要还是通过一个工业
场景 : 如何通过催化剂(Catalyst)和稳定剂( Stabilizer)配置比例的具体设定,才能获得某化学试剂的最低不纯度(I因子 催化剂%(Catalyst) 稳定剂%(Stabilizer) 低水平(-1) 0.586 0.586 高水平(+1) 3.414 3.414 显然,此时的工程师已经不满足于从仅有的四次全因子组合中选择最优的选项,而是希望在一个更广阔的可行性空间里充是最接近理想值的配置比例。当然,实现这一目的的同时还要兼顾试验的经济成本和时间次数等。 JMP进行响应曲面方法分析,试图获得化学试剂的不纯度最低时的配置比例。
施,并且及时收集每次试验的响应值。将以上结果汇总之后,即可得到如图三所示的JMP文件格式的数据表格。 图三 中心复合设计的试验结果汇总表
这时候,将传统的因子设计方法搁置一旁,适时地调用响应曲面方法,往往会起到最佳的效果。为了提高我们应用DOE的
首先,我们根据实际情况,以中心复合设计为原则,迅速地确定了13次运行次数的试验规模以及每次试验时的因子具体
然后,运用“模型拟合”的操作平台,就可以得到具体详尽的定量分析。遵循我们“强调通俗易懂,淡化统计原理”的两个图中都可以清楚地看到,在原试验范围内确实存在一个最小值。 图四 等高线图
墨,依然通过形象直观的图形来说明分析结果。在求出精确解之前,我们先观察一下图四所示的等高线图(Contour Plot)和
图五 曲面图
那么这个最小值究竟是多少?它又是在什么条件下产生的呢?进一步借助JMP自带的模型预测刻画器(Prediction Prof了模拟功能,实在难能可贵。
地得到最优化的配置比例:催化剂%=1.410568,稳定剂%=3.282724,这时产生的最低不纯净度%=3.156636。顺便提及,笔者尝
至此,我们匆匆走过了应用DOE优化流程的探索之路。其实在DOE的优化过程中,还有很多其他实用的知识和技巧,笔者图六 模型的预测刻画器
顾此不失彼的DOE
本系列前四篇中已经介绍了几种不同背景、不同要求的情况下,应用DOE的原理和技巧。但细心的读者会发现之前的案例
据分析仅限于单个响应变量。在实际工作中,常常会遇到要同时考虑多个响应变量的情况,例如希望断裂强度越大越好,同时
好,但同时希望成本越低越好等等。这类问题与古人所说的有些相像: “鱼与熊掌,能否兼得”?确实,如何同时考虑多项的六西格玛工具,其在DOE方面的表现最为优秀,本期案例我们仍以中英文双语版JMP软件作为DOE方案实现的载体。
就是另辟蹊径,设法解决处理多指标问题,使DOE也可以顾此不失彼。DOE方法的实现离不开统计分析软件的支持,高端六西
其实,解决这个问题的关键是能否创建一个新指标,用它来代表所有的旧指标,然后通过优化这个新指标,就可以实现多
这个新指标用什么来表示呢?答案是首先将原先的响应变量转化为另一个变量:意愿(Desirability ) ,它的建立可以将求