前のページへ戻るホームへ戻るテクノビジョダイジェスト
 
【連載 統計解析力アップ講座】
演習;統計的品質管理(2)

上田データマイニング塾
近藤 宏
上田 太一郎
 
統計的品質管理講座の第2回です。統計的品質管理は、品質に影響をおよぼす異常原因を見つけ出して対処することが目的です。そして、この異常原因を見つけるための基礎となる考え方が検定という統計手法です。

○例題1

次のような変更前の収量に対して、製造条件の変更後の収量が、変更前と違いがあるかどうかを検定してください。

変更前の収量
99.0 98.7 101.6 96.3 99.7 98.3 101.3 103.6 100.6 98.0
99.4 99.1 95.5 97.8 92.9 100.5 100.5 95.5 103.3 100.1
106.9 95.7 97.5 103.4 103.9 101.3 99.4 100.4 97.2 102.0
108.2 97.0 100.9 100.9 100.2 98.0 104.8 102.0 100.9 99.2
105.9 101.5 96.2 102.7 102.5 106.0 99.3 96.7 102.4 104.8
106.9 99.2 101.7 102.7 105.3 100.8 102.1 98.7 104.1 99.6
104.4 94.4 99.7 102.3 98.3 99.4 102.6 98.6 98.3 100.1
103.8 96.8 101.0 107.2 101.0 100.2 97.9 101.3 99.0 97.5
100.1 97.4 103.0 98.3 100.8 102.6 101.0 98.1 101.2 99.4
101.8 100.6 103.8 97.0 102.7 98.4 102.3 99.9 101.3 94.5

変更後の収量 平均
82 96 109 125 113 105

○検定とは

統計的品質管理では、まず異常原因になりそうな項目を要因として抽出し、その要因が変化したときに明らかな違いが発生したら異常原因だと判断します。検定とは、この明らかな違いがあるかどうかを統計的に判断する手法です。
違いがあるかどうかを比較する両者はいずれも正規分布であるとします。正規分布は平均値μと標準偏差σという2つのパラメータで数値化され、正規分布の面積が確率を表します。この正規分布の性質を利用することで、違いがあるかどうかを判断することができます。
具体的には、変更前の母集団の状態において変更後のデータの発生する確率が5%以下かどうかで判断します。

図


正規分布ではデータの発生する確率が面積として表現されますが、95%の確率で発生する範囲は平均値μを挟んで±1.96σの範囲となることがわかっています。
つまり変更後の値が、変更前の分布の±1.96σの範囲に入らなかった場合、変更前と明らかに違いがあったと判断するのです。

●例題1の答
まず、変更前の収量の正規分布を求めるとμ=100.1、σ=2.95と求められます。

変更前 μ 100.1 σ 2.95

変更後の収量の平均105が検定対象となりますが、この値はデータそのものでなく、データから計算して求めた値なので、上記の正規分布とそのまま比較できません。この正規分布から平均の正規分布を求める必要があります。
平均の正規分布の標準偏差σmは、データそのもののσより小さくなります。σmがどれぐらい小さくなるのかは、平均を求める元となったデータの個数nで決まります。平均値の標準偏差 σmは次の式で求められます。
図
n=5とσ=2.95より、変更前の平均の正規分布は次のように求められます。

平均の正規分布 μ 100.1 σm 1.32

この正規分布に対して、変更後の平均105がどれぐらいの確率で発生するのかを求め、その確率が5%未満であった時に変更前後で収量が明らかに異なっていると判断します。

すべての正規分布でμ±1.96σの発生確率が95%です。平均の正規分布についてこの範囲を求めると、

100.1−1.96×1.32=97.51 〜 100.1+1.96×1.32=102.69

となります。変更後の平均105.0は、この97.51〜102.69の範囲より外側になるので、その発生確率は5%未満となることがわかります。したがって、変更後の収量は、変更前と比較して明らかに異なっていると判断できました。

図

○例題2

次のように、変更前の収量のデータが少ないときの、製造条件を変更した後の収量のデータが変更前と違いがあるかどうかを検定してください。

  データ 平均値 標準偏差
変更前 98 101 102 104 95 100.0 3.54
変更後 82 96 109 125 113 105.0 16.51

●答
例題1のように変更前のデータが多い場合は、変更前の正規分布のデータの精度が高いので正規分布で検定を実施できます。しかしデータが少ないときは、正規分布では精度良く検定ができません。少ないデータで検定を実施する場合は正規分布ではない分布を使用します。
このとき使用される分布はt分布と呼ばれるもので、正規分布と同様にその面積が確率を表す確率分布です。次の図のようにt分布の形は正規分布と良く似ていますが、若干山が低く裾野が広くなった形をしています。t分布はデータの数にしたがってその分布の形が少しずつ異なります。データ数が大きくなるにつれ、その形は正規分布に近づいていき、データ数が無限大になったときt分布は正規分布と一致します。

図

このようなt分布を使用した検定をt検定と呼びます。t検定ではデータからt値という値を計算し、正規分布のときと同様にt分布の中心を挟んだ、両側の面積が全体の95%となる領域にt値が入るか入らないかで検定します。
t分布は中心値が0ですのでt値の絶対値を、t分布の右側の2.5%を示す値と比較するだけで検定することができます。
式

t値は次式で求められます。
式

ここで式、Sは検定対象のデータの平均と標準偏差、μは比較元のデータの平均、nはデータ数です。データからt値を求めると次のようになります。

式

t分布の右側の2.5%を示す値は、ExcelのTINV関数で次のように求められます。ここで0.05は確率の5%、5はデータ数です。

TINV (0.05, 5-1) = 2.776

求めたt値(の絶対値)がTINVの値より小さくなったので、変更後の収量は変更前と違いがあるとはいえない、という結果になりました。

○例題3

例題2と同じデータで、標準偏差について検定してください。

  データ 平均値 標準偏差
変更前 98 101 102 104 95 100.0 3.54
変更後 82 96 109 125 113 105.0 16.51
●答
平均値と同じ考え方で、標準偏差についても検定を実施することができます。ただし、標準偏差は正規分布で検定することができません。ばらつきが正規分布にならないのです。

標準偏差を2乗した数を分散といいます。分散は、比を取るとF分布という分布になります。標準偏差の検定にはこの性質を利用します。比較したいデータ各々の標準偏差を2乗し、その比をとってF分布上で検定します。この分散の比のことをF値または分散比といいます。
F分布は次の図のような形の分布で、面積が確率を表す確率分布です。計算したF値(分散比)がF分布上の95%の範囲に入るか入らないかで、標準偏差について検定することができます。F分布を使用することからこの検定をF検定と呼びます。

式
図2-16

F検定は、標準偏差の2乗の比を計算しF分布の95%の値を求めれば実施できます。Excelの「分析ツール」にはF検定を実施するツールが含まれていますので、ここでは「分析ツール」によるF検定の実施結果を次に示します。

式

「観測された分散比」と示された値がF値です。この値を「F境界値両側」で示された値と比較することで標準偏差についての検定を実施しますが、F値が1より大きいか小さいかで判定の仕方が次のように異なります。

F値が1より小さい場合は、「F境界値 両側」の値よりF値が小さいときに違いがあると判断します。
F値が1より大きい場合は、「F境界値 両側」の値よりF値が大きいときに違いがあると判断します。

今回の結果では、F値が1より小さい0.0459で「F境界値両側」の値0.1565より小さくなっているので、変更後の収量の標準偏差が変更前と明らかに異なっていると判断できます。

お疲れ様でした。第3回では分散分析について解説します。

<参考文献>
・「Excelでできる統計的品質管理」(同友館)
・「Excelで学ぶ営業・企画・マーケティングのための実験計画法」(オーム社)
・「新編 統計的方法」(日本規格協会)

著者紹介
近藤 宏(こんどう ひろし)


三菱電機(株)勤務。業務用空調機の開発、品質、生産管理業務に携わりながら統計的品質管理(SQC)・タグチメソッドを学ぶ。最近は統計解析手法、データマイニング手法を技術系だけでなく事務系範囲をも対象とした手法の啓蒙に着手している。主著に「Excelでできるデータ解析入門」「Excelでできる統計的品質管理入門」(以上同友館)、共著に「Excelで学ぶ営業企画マーケティングのための実験計画法」「Excelで学ぶ時系列分析と予測」(以上オーム社)、「Excelでできるタグチメソッド解析法入門」(同友館)がある。



前のページへ戻るホームへ戻るテクノビジョンダイジェスト