新技術開発センター

Webスクール

データマイニングとは



データマイニングとは

データマイニングとは、データウェアハウス(データの倉庫、データベース)などに蓄積された生データを、マイニング(採掘)し、宝物である情報・仮説・知見・課題等をみつけ出すことをいいます。
その分析結果を基に、法則性の発見、効果測定、予測など様々なファクターが導き出すことが可能です。この結果を基に、さまざまな対策が戦略的にとれるわけです。

ここで、データマイニングを用いた例を1つご紹介いたしましょう。

カナダのドラッグストアでPOSデータを分析し、金曜日の夕方、男性がビールと紙オムツを併せ買いをしていることを見つけ出しました。そこで、その商品同士を一緒に置く対策をとり、売上げを伸ばしたそうです。
データをマイニングすることにより、併せ買いを見つけ、つまり仮説を見つけ、それを実際に検証すること、仮説構築検証型が先進的な企業に求められているのです。

このようにビールと紙オムツの併せ買いなど常識では考えられないようなこと(知見、仮説)がデータをマイニングすることでわかることがあるのです。

(POSデータ:バーコードから読み込まれたデータのこと「POS;point of sales,販売時点情報管理システム」、顧客データ、販売データ、生産データ、受注データ、POSデータ等の膨大なデータから、購買客の購入傾向をみつけだす等に適用されています 。)

データマイニング手法

データマイニングの具体的な手法には知識工学、ニューラルネットワーク、フラクタル、パターン認識、ファジー理論、統計解析等がありますが、この中で統計解析は、最も代表的なデータマイニング手法です。

現在では、統計解析ソフトもいろいろ開発され、SPSS,STATISTICA、S、S-PLUS、JMP、KnowledgeSEEKER、JUSE/MA等がありますが、一般的に意外と知られていないのが、今回この講座で利用するExcelです。

Excelは、データマイニング・ツールであるばかりか、データウェアハウスの機能も兼備えているのです。

データウェアハウス

データマイニングとデータウェアハウスは切手も切離すことは出来ません。データを分析するにはデータがなければならないのですから。

データウェアハウスの特徴は何でしょう。

日次データ、月次データ等時系列データも取込むことも特徴の1つです。売上げデータ、顧客データ等企業にとって重要なデータが入っています。つまり、データの宝庫です。

データウェアハウスマシンの開発も進められ、実用機(三菱電機のDIAPRISM等)も出はじめました。膨大なデータを相手にするわけですから、マシンには高速処理(ハードウェアとアルゴリズム)が要求されます。DIAPRISMはこれを実現したプロセッサー(100万行を2秒で処理)として注目されています。

データウェアハウスおよびデータマイニングツールExcel

データウェアハウスの身近なものにExcelがあります。しかも、Excelは解析ツールおよび可視化(グラフ化)ツールも備えておりますので、立派なデータマイニングツールでもあるのです。Excelは、こんなに身近なソフトで優秀な機能を備えているにもかかわらず、その機能を十分に利用されていないのが現状なのです。ほとんどのパソコンにはExcelが、インストールされているので、数十万もするデータマイニングソフトを、新たに購入する必要もありません。ある程度の分析はExcelの機能で出来るのです。