界定阶段概述: 1.测量阶段工作内容
测量阶段的工作重点是在界定阶段工作的基础上,进一步明确Y的测量,并通过收集X和Y的测量数据,定量化地描述Y。特别是通过过程分析,认识Y的波动规律,揭示过程改进的机会,识别实现项目目标的可能途径和改进方向。 2.M阶段目标、工具和目的 步骤 常用工具 主要输出与目的 ? 测量系统的分析; ? 流程能力现状确认; ? 原因变量识别; ? 原因变量筛选; ? 改善效果的验证; ? 确定进一步分析的原因变量。 1.针对Y的测量系统排列图,不良质量成本,分析 因果图,水平对比法,散2.流程能力分析 布图,直方图,流程图,3.分析当前流程图 趋势图,测量系统分析,4.影响因素识别与筛检查表,FMEA ,抽样计选 划,过程能力分析,C&E5..快速改善及效果验矩阵,控制图 证 6.测量阶段结论 5.1 过程分析与文档 进行过程分析的目的是:
(1)使项目团队对准备改善的过程达成一致认识; (2)对产生问题或缺陷的区域进行定位; (3)识别不增值步骤,以便加以改进;
(4)将过程步骤的现状记录并形成文档,与改善后的状况进行对比。 5.1.1 流程图
1.绘制流程图的常用符号 2.绘制流程图的步骤
(1)判定过程的开始点和结束点; (2)观察从开始到结束的整个过程;
(3)识别过程中的步骤(包括主要活动、判断、决策点等),以及各个步骤或活动的流向和相互关系。
(4)绘制出上述步骤,形成流程图草图。
(5)团队成员就此草图进行充分的讨论并达成一致。 (6)形成正式文档。 3.流程图实例(略) 5.1.2 因果图与因果矩阵
1.因果图
因果图又称石川馨图,或称鱼刺图,是以结果作为特性,以原因作为因素,在它们之间用箭头联系起来表示因果关系,它是揭示过程输出缺陷或问题与其潜在原因之间关系的图表,也是表达和分析其因果关系的重要工具和文档。(图略)
2.因果矩阵
当预期解决的问题比较复杂,有多种缺陷形式且它们的影响因素相互关联,无法将它们分开来考察和解决时,可以采用因果矩阵(cause and effect matrix)分析。 5.1.3其他过程分析工具与文档
3.FMEA
过程失效模式与后果分析(Process Failure Modes and Effects Analysis,PFMEA)是一种综合分析技术,主要用来分析和识别工艺生产或产品制造过程可能出现的失效模式,以及这些失效模式发生后对产品质量的影响,从而有针对性地制定出控制措施,以有效地减少工艺生产和产品制造过程中的风险。
PFMEA通过对工艺产品和产品制造过程要求和功能的系统分析,凭借以往的经验和过去发生的问题,在最大范围内充分考虑到那些潜在的失效模式及其相关的起因和后果,从而解决在产品生产过程中的关键问题。
PFMEA包括以下几个关键步骤:
(1)确定与工艺生产或产品制造过程相关的潜在失效模式与起因。 (2)评价失效对产品质量和顾客的潜在影响。
(3)找出减少失效发生或失效条件的过程控制变量,并制定纠正和预防措施。 (4)编制潜在失效模式分级表,确保严重的失效模式得到优先控制。 (5)跟踪控制措施的实施情况,更新失效模式分级表。
5.2 概率论与数理统计基础 5.2.1概率论基础知识 (一)基本概念
1、统计学(statistics):收集、处理、分析、解释数据并从中得出结论的科学。 2、描述统计(descriptive statistics):研究数据收集、处理和描述的统计学分支。 3、推断统计(inferential statistics) :研究如何用样本数据来推断总体特征的统计学分支。
4、总体(population):包含所研究的全部个体(数据)的集合,称为总体。根据所包含的单位数目是否可数可以分为有限总体和无限总体,区分有限总体和无限总体的目的是判别每次抽样是否独立。 5、样本(sample):从总体中抽取的一部分元素的集合称为样本。 6、样本量(sample size):构成样本的元素的数目称为样本量或样本容量。 7、参数(parameter):用来描述总体特征的概括性数字度量称为参数。参数包括均值、标准差、比例等。一般用希腊字母表示。 8、统计量(statistics):用来描述样本特征的概括性数字度量称为统计量。通常用英文字母表示。
(二)概率论基础知识 1、试验、事件和样本空间
试验:对一个或多个试验对象进行一次观察或测量的过程称为一次试验。 试验的特点:
(1)可以在相同条件下重复进行; (2)每次试验的可能结果不止一个,但试验的所有可能结果在试验之前是确切知道的; (3)在试验结束之前,不能确定该次试验的确切结果。
例:抛掷一枚均匀硬币;投掷一枚骰子;从一批次品率为p的产品中随机抽取一件,观察其是正品还是次品
事件:试验的结果称为事件。也称为随机事件,通常用大写英文字母A、B、C表示。 基本事件:不能被分解成其他事件组合的事件,又称为简单事件。 必然事件:在一定条件下一定发生的事件。用Ω表示。
不可能事件:在一定条件下一定不发生的事件。用φ表示。
样本空间:一项试验中所有可能结果的集合称为样本空间,用Ω表示。 样本点:样本空间中每一个特定的实验结果,称为样本点。用ω表示。 2、概率
(1)事件A的概率是对事件A在试验中出现的可能性大小的一种度量 (2)表示事件A出现可能性大小的数值,事件A的概率表示为P(A) 概率的统计定义:在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数p上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为:
m
P(A)??p n3、概率的性质和运算法则(见书130-131)
二、随机变量及其分布 1、随机变量
随机试验:在同一组条件下,对某事物或现象所进行的观察或试验叫随机试验(Experiment)。
随机事件:随机试验的结果叫随机事件。
随机变量:如果随机试验的每种结果都可以用一个数字表示,则称此变量为随机变量。 离散型随机变量:只能取有限个或可能个值的随机变量。
连续性随机变量:可以取一个或多个区间中任何值的随机变量。 2、离散型随机变量及其分布
离散型随机变量的概率分布:列出随机变量X的所有可能取值以及每个值的概率,并用表格的形式表现出来,称为离散型随机变量的概率分布。 3、连续性随机变量及其分布 (1)概率密度函数
连续型随机变量可理解为“可以取某一个或若干个区间内任意数值的随机变量”。一组样本数据绘制直方图,随着数据的不断增加,频率区域稳定,连接直方图每个矩形上方中点接近一条光滑的曲线,频率的稳定值就是概率,单位长度上的概率简称概率密度,这条曲线的函数即为概率密度函数。
概率分布是总体分布的理论(数学)模型,特别是总体相对频数分布的理论模型。 描述连续型随机变量分布最重要和最基本的工具。概率密度函数需要满足3个条件:
(1)p(x)?0,概率密度函数为非负函数
??
(2)轴围成的面积为1?-?p(x)dx?1,概率密度函数曲线与实
b (3)P(a?X?b)??p(x)dx,区间[a,b]上的概率可由概率a
密度函数在该区间上求积分得到
P(a?X?b)?P(a?X?b)?P(a?X?b)?P(a?X?b)
(2)累积分布函数(累积概率)
对于随机变量X,设x为任意实数,则函数
x F(x)?P(X?x)??p(t)dt-?
称为随机变量X的分布函数(累积概率)。
? 分布函数F在x处的取值,就是随机变量X的取值落在(-∞,x)上的概率。 在某一个区间[a,b]上的概率可以由概率密度函数在该区间上求积分得到,也就是区间上限的累积分布函数减去区间下限的累积分布函数。 ? 分布函数(逆累积概率)已知概率值求临界点 ? 随机变量的分位数
“长江三峡可以抵御百年一遇的洪水”是什么意思?
随机变量的分位数:随机变量X的取值比某个数大的概率为1/T,则称此数为“T年一遇”。
三、描述性统计 1、集中趋势的度量
(1)众数Mo:出现频数最多的变量值。
(2)中位数Me:排序后处于中间位置的变量值。 ?X?n?1?,n为奇数???~?2? ?X??1?? ??X?n??X?n??,n为偶数 ??1??2?????2?????2?
(3)四分位数
第一四分位数:首先将样本从小到大排序,记其中的第i名为X(i)。对于n个数,求出
(n+1)/4,整数部分记为k,小数部分记为f,则: Q1=X(k)+f×(X(k+1)-X(k))
第三四分位数:首先将样本从小到大排序,记其中的第i名为X(i)。对于n个数,求出3×(n+1)/4,整数部分记为k,小数部分记为f,则: Q3=X(k)+f×(X(k+1)-X(k))
(4)众数、中位数、均值三者之间的关系
nn(5)均值μ xiMifi?? 未分组数据x?i?1分组数据x?i?1nn
(6)众数、中位数、均值三者之间的关系
众数是一组数据分布的峰值,不受极端值的影响,但缺点是有可能不唯一,适合于分类数据的集中趋势测度值;中位数是一组数据中间位置上的代表值,在数据分布偏斜程度较大时适合作为数值型数据集中趋势的测度值;均值利用了数据的全部信息,当数据对称或接近对称时,应选择均值作为集中趋势的代表值。 2、离散程度的度量
(1)极差:一组数据的最大值与最小值之差
(2)方差:各变量与其平均值离差平方和的平均数
s2??(xi?1ni?x)2n?1s2?
?(Mi?1ni?x)2fin?1(3)标准差:方差的平方根,量纲与变量值相同。
nn 22(x?x)(M?x)fi??ii
i?1i?1 s ? n ? 1 s?n?1 方差性质:
1.V(C)?0 22.V(aX)?aV(X)
3.V(aX?b)?a2V(X)
4.V(X1?X2)?V(X1)?V(X2) 5.V(aX1?bX2)?a2V(X1)?b2V(X2)
6.如果有n个随机变量独立且方差相等(记为?2),则:
V(X1?X2?...?Xn)?n?2
1?2V(X)?V((X1?X2?...?Xn))? nn
(4)四分位间距IRQ=Q3-Q1
标准差最常用,对离散状况有较好的代表性,与样本量关系不密切,但缺点是对异常值敏感;极差与样本量关系密切,对异常值敏感,但计算简单;四分位间距与样本量关系不密切,对异常值不敏感,是所有离散状况度量的统计量中最稳健的。 3、偏态与峰态的度量(样本数据)