设有两个独立的正态总体N(?1,?2)和N(?2,?2),X1, X2,...Xn是来自N(?1,?2)的一个样本,Y1,Y2,...Yn是来自 2N(?,?)的一个样本,两个样本相互独立,两样本方差2
之比是自由度为n?1和m?1的F分布: 1n2(X?X)? S12n?1i?1iF?2?~F(n?1,m?1)n 1S2(Yi?Y)2? n?1i?1
5.3.1数据类型与测量尺度 1、数据的类型
分为连续型数据的离散型数据。连续性数据对测量手段要求较高(测量成本较高),但信息量比较丰富;离散型数据在反映过程变化方面不如连续型数据敏感,往往需要较大的样本量或较长的测量周期才能得出结论。
六西格玛项目在收集数据时,应尽量采用连续型数据。 2、测量尺度
(1)定类(名义)测量尺度
数据是数字形式的名义值。如0=白色,1=非白色。
将事物分到唯一的类中,这些类必须是互斥的,而且是完备的。 能识别的关系只有“=”和“≠”。 (2)定序测量尺度
定序变量对可能的取值进行排序。 如以“好”、“更好”、“极好”来划分顾客对某种服务的偏好。
对定序数据可以进行“计数”和“排序”运算,但不能进行算术平均。 (3)定距测量制度
连续型数据的一种,没有倍数(比率)的概念,如时间和温度等。可以使用算术平均和线性变换。
(2)定比测量尺度
同一个事物的两个不同测量结果之间的比值有意义,不但可以识别差距的大小,而且可以识别和比较比值的大小。
可以求算术平均值,计算各种统计量,而且可以用除法求倍数。 5.3.2收集数据的方法(略) 5.3.3抽样方法 1、简单随机抽样
从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方法称为简单随机抽样。 简单随机抽样要满足两个基本条件:等可能性和独立性。
常用的随机抽样方法:抽签法、滚球法、计算机模拟、随机数表法 2、分层抽样
在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本,这样的抽样方法称为分层抽样,也称分类抽样。 3、系统抽样
先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的
间隔抽取一个元素,直至抽取n个元素形成一个样本,这样的抽样方法称为系统抽样,也称等距抽样或机械抽样。 4、整群抽样
先将总体划分成若干群,然后在以群为抽样单位从中抽取部分群,在对抽中的各个群中所包含的所有元素进行观察,这样的抽样方法称为整群抽样。 5.3.5数据的图示方法 1、直方图
常用于了解数据的分布情况,容易从图形中看出数据的分散程度和中心趋势。 直方图步骤:
? 从n个样本数据中找出最大值和最小值,计算极差;
? 对样本进行分组,决定组数k和组距d。k的取值范围在7-15之间,d由极差R和组数k来确定,通常d=R/k; ? 确定各组的区间端点a0。a0+d=a1, a1+d=a2, a2+d=a3…形成半开半闭区间:[a0, a1), [a1, a2), [a2, a3)…
? 计算样本落在每个区间的频数ni; ? 绘制图形。 2、茎叶图
直方图的变种,全部或部分地保留了原始数据的信息。 3、数据箱线图
箱线图由箱体、上下须触线和星号三部分组成。 4、链图
也称趋势图。显示任何测量特性随时间变化的图表。 绘制步骤:
(1)依时间顺序画数据折线图; (2)画一条表示中位数的水平线。
可以用链图判断过程是否受到特殊因素的影响:
(1)链的长度:指位于中位数同一侧的连续点数目(忽略落在中位数上的点)。 (2)链的数目:位于中位线同一侧的连续的点的序列构成一个链。 (3)趋势:链图中不应该存在任何异常的连续上升和连续下降的序列。 5、正态概率图
正态坐标纸横坐标等间隔,纵坐标按标准正态分布的累积概率标示。
5.4 测量系统分析 5.4.1 基本概念
测量:以确定实体或系统的量值大小为目标的一整套作业。(将一个未知量与一个已知的或已经接受的参照值进行的比较。)
测量系统:由人员、仪器或量具、测量对象、操作方法和环境所构成的整体。
测量系统分析:运用统计学的方法对来了解测量系统中的各个波动源,以及它们对测量结果的影响,最后给出测量系统是否合乎使用要求的明确判断。
测量系统必须具有良好的准确性和精确性,分析主要从稳定性、偏倚、线性、分辨力、重复性、再现性六个方面进行评估。 测量系统必须具有良好的准确性(accuracy)和精确性(precision)。通常用偏倚(bias)和波动(variation)来表征。
对相同测量对象的同一特性进行多次测量,多次测量的结果形成一个分布,此分布
有均值μ和标准差σms。偏倚就是指理论上的平均值μ与其参考值Vr之间的差值。精确度是指此分布的范围,一般用6 σms表示(红书用5.15 σms 表示)。
测量数据质量高,既要求偏倚小,又要求波动小。 5.4.2 测量系统分辨力
测量系统的分辨力是指测量系统识别并显示被测量最微小变化的能力。
分辨力往往可通过仪器仪表上的最小刻度来反映。对于连续型数据,一般称测量结果的最小间距Unit为分辨力。
测量系统分辨力最起码的要求应当使Unit同时不大于过程总波动PV(6倍过程标准差)的1/10和公差限(USL-LSL)的1/10。
Unit?min(
6?USL?LSL,)1010
如果分辨力不足,控制图上极差值少,可能出现失控。
可用可区分组数(number of distinct categories,ndc)作为判断分辨力是否足够的一个标准。
???2??? ?ndc??1.41?????????? ??分辨力对过程控制与分析的影响 p2pMS2MS可区分组数 1 控制 分析 多数情况下不能用于控只能指出过程的输出是否合格,不能制图 用于过程参数及指数的估计 能用于不太敏感的计量2~4 只能用于过程参数及指数的粗略估计 型控制图 表明测量系统的分辨力合格,能够用能够用于各种类型的控≥5 于过程参数及指数的估计。ndc≥10制图 表明分辨力优良 5.4.3 测量系统的偏倚、线性和稳定性 1.测量系统的偏倚
对相同测量对象的同一特性进行多次测量,测量结果形成一个分布(通常为正态分布),偏倚是指多次测量的理论上的平均值μ与其参考值Vr之间的差异。
参考值的主要来源:多个准确测量设备所得重复测量值的平均值、专业团队认可的值、当事方达成一致的值或法律规定的值。 例:(蓝书P346)一家公司的质检部门新购买一台测厚仪,在正式使用之前,需要对此测量系统进行评估。根据实际需要的量程范围,挑选了5个具有代表性的标准部件,然后由质检员以随机方式对每个部件测量6次。假设已知过程总波动PV(即6倍的过程标准差)为12。试分析其偏倚和线性。 2.测量系统的线性
指在测量系统预期的量程范围内各点处的偏倚与参考值呈现线性关系,在数学上表现为偏倚对应参考值的线性回归关系。
测量系统最好是在任何一处都不存在偏倚,但如果知道在某点处的偏倚,或在整个测量系统内有共同的偏倚,则可进行修正。如果测量系统有偏倚,但又不存在线性关系,则无法处理。
通常用线性度衡量某个量程的偏倚的总体变化程度。其量纲与Y量纲相同。
Linearity?b?PV代表过程总波动范围内测量值偏倚的波动范围。线性度也可以用百分比的形式表示:
%Linearity?(Lineartiy)/PV)?100?|b|?100
3.测量系统的稳定性
稳定性通常是指某个系统其计量特性随时间保持恒定的能力。
对于任何一个质量特性而言,具有稳定性是指分布不随时间变化,其平均值、标准差以及分布的形状等都不随时间变化。通常用Xbar-R图或Xbar-S控制图进行分析测量系统的稳定性。
5.4.4 测量系统的重复性和再现性 1.重复性(repeatability)
重复性是指在尽可能相同测量条件下,对同一测量对象进行多次重复测量所产生的波动。重复性主要反映量具本身的波动。“尽可能相同测量条件”是指同一个操作员、对同一个测量对象的同一部位,放在测量仪器中的同一位置,在较短的时间间隔内进行多次测量。重复性又被称为设备波动(EV)。
重复性除选用其标准差σRPT作为绝对量的度量指标外,还可以用设备波动与过程总波动(TV)的比值作为其相对量的度量指标。 EV6?RPT?RPTGageRPT??? TV6?TV?TV2.再现性(reproducibility)
也称复现性或重现性,是指在各种可能变化的测量条件下,对同一测量部件的同一特性进行多次测量,所得结果的一致性。相当普遍的情况是误差主要由不同的操作人员引起,再现性又被称为人员波动(AV)。
再现性除选用其标准差σRPD作为绝对量的度量指标外,还可以用人员波动与过程总波动(TV)的比值作为其相对量的度量指标。
AV6?RPD?RPD
GageRPD??? TV6?TV?TV3. 测量对象间的波动
4、总波动的分解和测量系统能力的评价准则
Xrst???Or?Ps?(OP)rs?erst 式中?为总均值,O,P,(OP),e分别是操作者、部件、操作rsrsrst 2者与部件交互作用测量误差的随机变量,假设Or~N(0,?O)
222 Ps~N(0,?P),(OP)rs~N(0,?OP),erst~N(0,?e)且相互独立2222222 ?T??O??P??OP??e2??P?((?O??OP)??e2) ??2?(?2??2)??2??2PRPDRPTPms 2两端同乘以5.15(62)得:(TV)2?(PV)2?(AV)2?(EV)2
R&R?(AV)2?(EV)2PV?(TV)2?(R&R)2 R&RR&R%P/TV?%GageR&R??100%%P/T??100% TVUSL?LSL(1)若%GageR&R及%P/T两项指标皆小于10%,则测量系统良好;
(2)若%GageR&R及%P/T两项指标有一项大于30%,则测量系统不合格;
(3)若处在(1)与(2)之间,则测量系统处于边缘状态。当测量系统测量的指标并非产品的关键性能指标,且更换测量系统在经济上不可行时,则测量系统可以勉强使用,否则应加以改进后才能使用。 5.重复性和再现性分析实例 典型步骤:
(1)随机选10~20个零件,将其编号,且编号不让操作员看到
(2)随机选2个以上的操作员(无操作员差别的测量系统换成其他不同测量条件) (3)让每个操作员按随机顺序对全部零件测量一遍,让他们按另外一种随机顺序再测量一遍或多遍;
(4)将所有记录按固定顺序整理好,进行整个测量系统分析。 测量系统的方差分析表 Xrst???Or?Ps?(OP)rs?erst波动源 操作者(O)
自由度
R平方和
SSO?ST?(Xr..?X...)2r?1均方
MSO?SSOR?1F值
MSO MSOPR-1
部件(P) S-1
SSP?RT?(X.s.?X...)2s?1S
MSP?SSPS?1
MSP MSOP操作者(O)(R-1)(S-1)
×部件(P)
误差
RS(T-1)
SSOP?T??(Xrs.?Xr..?X.s.?X...)2r?1s?1RS
MSOP?SS OP(R?1)(S?1)MS OPMSe
SSe????(Xrst?Xrs.) 2r?1s?1t?1RSTMSe?SSe RS(T?1)总和 RST-1
2SST????(Xrst?X...)
r?1s?1t?1RSTMST?SST RST?1
以上表为基础,计算各波动源的方差分量