テクノビジョンダイジェスト

【連載　統計解析力アップ講座】
演習；実験計画法とタグチメソッド(4)
　　第３回演習問題の解答と課題

上田データマイニング塾
上田太一郎

問１　図表22の折れ線グラフは図表23です。

図表23　図表22の折れ線グラフ

図表23より、10度のとき生成量が最大になりそうであることがわかります。

問２　１元配置のデータから分散分析表を求める公式は次のとおりです。

変動要因	平方和	自由度	平均平方(分散)	F0(分散比)	P-値	F境界値
A	S_A	a－1	S_A/(a－1)＝V_A	V_A/V_e	(注1)	(注2)
誤差	S_e	a (n－1)	S_e/a(n－1)＝V_e
合計	S_T	an－1

　(注)繰返し数が水準ごとに異なる場合
　n₁, n₂,・・・, n_aのときも同様、n₁＋n₂＋・・・＋n_a＝Nとすれば、誤差の自由度は、N－a、
　合計の自由度はN－1となる。
　(注1)P－値は、関数FDIST(F,f₁,f₂)＝FDIST(V_A/V_e, a－1, a(n－1))を用いる。
　(注2)F境界値は関数FINV(F,f₁,f₂)＝FINV(0.05, a－1, a(n－1))を用いる。

図表22の分散分析表は図表24です。

図表24　図表22の分散分析表
　　　　　　分散分析表

変動要因	変動	自由度	分散	観測された分散比	P-値	F境界値
温度	0.566	3	0.189	4.535	0.017	3.239
誤差	0.666	16	0.042
合計	1.232	19

〈分散分析とは〉
全変動を要因である温度による変動と誤差変動に分解します。
要因変動を誤差変動で割り、これを分散比F0とよびます。
分散比F0がF分布に従うことがわかっているので、この値が出現する確率P－値(危険率)を求め、この値が小さい(たとえば５%以下)と要因変動が有意であると判定します。
図表24より、P－値が0.017(1.7%)と小さい値になっています。
つまり温度が生成量の増減に影響をおよぼしていると判断します。
また、Excelの分析ツールを用いて分散分析表を求めることもできます。
操作手順は次のとおりです。

メニューバーの「ツール」から「分析ツール」を選びます(図表25)。

図表25
「データ分析」ウインドウが表示されます。
「分散分析:一元配置」を選んでOKをクリックします。

図表26　「データ分析」ウインドウ
図表27のように入力範囲を指定し、ラベルに'をつけOKをクリックします。

図表27
出力結果は図表28です。

図表28

問３　図表22の計画行列は図表29です。

図表29　図表22を計画行列に直したもの

温度	生成量	温度	生成量
10度	2.3	30度	2.3
10度	2.9	30度	2.0
10度	2.6	30度	2.0
10度	2.4	30度	2.3
10度	2.6	30度	2.2
10度	2.5	30度	2.0
20度	2.7	40度	2.5
20度	2.0	40度	2.6
20度	2.6	40度	2.4
20度	2.4	40度	2.3

問４　図表29を０,１データに作り直します。

図表30　図表29を０,１データに作り直したもの

10度	20度	30度	40度	生成量	10度	20度	30度	40度	生成量
1	0	0	0	2.3	0	0	1	0	2.3
1	0	0	0	2.9	0	0	1	0	2.0
1	0	0	0	2.6	0	0	1	0	2.0
1	0	0	0	2.4	0	0	1	0	2.3
1	0	0	0	2.6	0	0	1	0	2.2
1	0	0	0	2.5	0	0	1	0	2.0
0	1	0	0	2.7	0	0	0	1	2.5
0	1	0	0	2.0	0	0	0	1	2.6
0	1	0	0	2.6	0	0	0	1	2.4
0	1	0	0	2.4	0	0	0	1	2.3

〈重要な注意〉
　図表30のままでは回帰分析を実行できません。
　その理由は、全ての行について、
　　　　10度＋20度＋30度＋40度＝１
　という関係式が成り立つからです。
　つまり自由度は４－１＝３なのです。
　実行するにはいずれかの１列データを削除して自由度を３に
　しなければなりません。
　(注)自由度とは有効な情報の数のことです。

　　図表30の回帰分析実行結果は図表31です。ここでは30度の列を削除しました。

図表31　回帰分析実行結果
概要

回帰統計
重相関 R	0.677902
重決定 R2	0.459551
補正 R2	0.358217
標準誤差	0.203997
観測数	20

分散分析表

	自由度	変動	分散	観測された分散比	有意 F
回帰	3	0.566167	0.188722	4.535002	0.017493
残差	16	0.665833	0.041615
合計	19	1.232

	係数	標準誤差	t	P－値	下限 95%
切片	2.133333	0.083281	25.61602	2.05E-14	1.956785
10度	0.416667	0.117777	3.537746	0.002736	0.16699
20度	0.291667	0.131679	2.214979	0.041618	0.012519
40度	0.316667	0.131679	2.404835	0.028642	0.037519

問５
　要因である温度が生成量の増減に効いているかは要因選択規準Ruを計算し、
　　　　　　Ru＞０
を満たすなら効いていると判定します。

要因選択規準Ruを求める式は、次のとおりです。

【要因選択規準Ruを求める式】

Ru＝1－(1－R²)	n＋k＋1	・・・式１
	n－k－1

R：重相関係数
n：データ数
k：水準数－１

式１より、

Ru＝1－ (1－0.68²) ×	20＋3＋1	＝0.189
	20－3－1

Ru＞０となるので、温度が生成量の増減に影響を及ぼしていると判断します。

問６　図表31より、生成量を求める回帰式は、

生成量＝2.13＋	0.42 (A1)
	0.29 (A2)
	0.00 (A3)
	0.32 (A4)

となります。生成量が最大となるのはA1（10度）のときで、
このとき生成量は
　　y＝2.13＋0.42＝2.55
と推定することができます。

●演習問題４

繰り返し数が１のときで、２要因実験データを解析しましょう。
図表32は、機械（A社製、B社製、C社製）と温度（10度、20度、30度、40度、50度）の条件下のもと、生成量がいくらになるかを測定した実験データです。

図表32　２要因実験データ

	10度	20度	30度	40度	50度
A社製	83	86	87	85	87
B社製	80	82	82	86	83
C社製	79	79	82	83	82

要因：機械、温度
水準：機械（A社製、B社製、C社製）、
　　　温度（10度、20度、30度、40度、50度）
です。
生成量の増減に機械および温度は効いているでしょうか？
効いているとすれば、どの会社の機械を用いて何度のとき生成量が最大になるでしょうか？

問１　折れ線グラフを描きなさい。
問２　分散分析表を作りなさい。
問３　計画行列を作りなさい。
問４　回帰分析を実行しなさい。
問５　生成量が最大になるときの条件(最適水準)を求めなさい。