前のページへ戻るホームへ戻るテクノビジョダイジェスト
 
【連載 統計解析力アップ講座】
演習;実験計画法とタグチメソッド(2)
  第1回演習問題の解答と課題
上田データマイニング塾
上田 太一郎
 

●第1回 演習問題1 解答

データ解析の鉄則は「まず、グラフを描け!」です。
図表1の折れ線グラフを描いてみましょう。

図表3 図表1の折れ線グラフ


図表3からわかるように、平均値が目標値9.8mmに近いのはB社です。しかしB社の方がばらついています。
ばらつきの指標である標準偏差はA社=1.15、B社=3.82です。
目標値はB社の方が良く、ばらつきはA社の方が良いのです。
目標値とばらつき両方を考慮したものさしが望目特性のSN比です。
望目特性のSN比を求めてみましょう。計算式は、

SN比(望目特性)=10×log ・・・式1
σ²
m:一定の目標値 σ:標準偏差


となります。
式1より、A社、B社のSN比(望目特性)を計算します。
A社のSN比(望目特性):17.38db
B社のSN比(望目特性):−3.47db

SN比は大きいほど良いので、A社を採用すべきだということがわかります。

●第1回 演習問題2 解答

(1) 図表2の折れ線グラフは図表4のようになります。

図表4 図表2の折れ線グラフ


(2) 図表4の折れ線グラフについて多項式(ここでは2次と3次)、指数、累乗、対数の近似曲線を求めます。
Excelのグラフ機能を使うことで求めることができます。

【Excelの操作説明】
  1. 「グラフエリア」を1回クリックし、メニューバーのグラフから、「近似曲線の追加」を選びます。

    操作画面1

  2.  「近似曲線の追加」画面が表示されます。
    近似曲線の種類を設定します。
    たとえば、2次式の近似曲線を追加したいなら、「多項式近似」を選び、「次数」を「2」に設定します。
    次に、「オプション」タブをクリックし、「グラフに数式を表示する」にチェックをつけ「OK」をクリックします。

    操作画面2

  3. 図表4に近似曲線(2次の多項式近似)を追加したグラフが完成します。

    操作画面3

多項式近似(2次) :y = 98.04 x² −911.56 x+1970.12 ・・・式2
多項式近似(3次) :y = 9.46 x³−143.11 x²+778.40 x−779.02 ・・・式3
指数近似 :y = 119.63 exp0.30 x ・・・式4
累乗近似 :y = 57.21 x1.71 ・・・式5
対数近似 :y = 3626.30Ln(x) − 3562.90 ・・・式6

式2、式3、式4、式5、式6に、x=17を代入し、予測値をそれぞれ求め、実測値(16990)との相対誤差を求めます(図表5)。

図表5 予測値と相対誤差
 
予測値 相対誤差(%)
多項式近似(2次) y=ax²+bx+c 14807.16 12.85
多項式近似(3次) y=ax³+bx²+cx+d 17571.97 −3.43
指数近似 y=aebx 19621.94 −15.49
累乗近似 y=axb 7270.09 57.21
対数近似 y=a loge ( x )+b 6711.18 60.50

図表5より、3次式を用いたときの予測精度が一番良いことが分かります。
したがって3次式(y = 9.46 x³−143.11 x²+778.40 x−779.02)が最適な曲線であると判断します。
最適な曲線を求めるための統計的な指標に、選択規準Ruがあります。

【Ruを用いて最適な曲線を求める方法】
Ru=1− (1−R²) n+k+1 →Ruが最大になるものが最適
n−k−1
R:重相関係数
n:データ数
k:パラメータ数

Ruを用いて、式2〜6のどれが最適な曲線か判断してみましょう。

図表6 Ru値一覧
  パラメータ数 Ru
多項式近似(2次) 3 0.944
多項式近似(3次) 4 0.996
指数近似 2 0.991
累乗近似 2 0.846
対数近似 2 0.236

図表6より、選択規準Ruの値からも多項式近似(3次)が最適な曲線であることがわかります。

第2回 演習問題

図表7はソフトウェア開発時のバグの累積数データです。

図表7 バグ累積数
経過週(x) バグ累積数(y)
1 30
2 72
3 200
4 231
5 239
6 322
7 356
8 369
9 429
10 510

最終のバグ累積数はいくらになるか、知りたいですね。

問1 折れ線グラフを描きなさい。
問2 成長曲線:ロジスティック曲線
   y = a / (1+be−cx) のa、b、cを求めなさい。
問3 成長曲線:ゴンペルツ曲線
   y = ae−bcx のa、b、cを求めなさい。
問4 どちらの成長曲線が当てはまりが良いですか。
問5 最終バグ累積数および収束する週は何週目でしょうか。

【ヒント】
田口玄一著「第3版 実験計画法 上」丸善 に実験的回帰分析の解説があります。この方法でも求まりますが、今ではExcelという強力な武器があります。Excelのソルバーを使えば簡単です。

前のページへ戻るホームへ戻るテクノビジョンダイジェスト