![]() |
![]() |
![]() データマイニングとは ![]() データマイニングとはデータマイニングとは、データウェアハウス(データの倉庫、データベース)などに蓄積された生データを、マイニング(採掘)し、宝物である情報・仮説・知見・課題等をみつけ出すことをいいます。 ここで、データマイニングを用いた例を1つご紹介いたしましょう。 カナダのドラッグストアでPOSデータを分析し、金曜日の夕方、男性がビールと紙オムツを併せ買いをしていることを見つけ出しました。そこで、その商品同士を一緒に置く対策をとり、売上げを伸ばしたそうです。 このようにビールと紙オムツの併せ買いなど常識では考えられないようなこと(知見、仮説)がデータをマイニングすることでわかることがあるのです。 (POSデータ:バーコードから読み込まれたデータのこと「POS;point of sales,販売時点情報管理システム」、顧客データ、販売データ、生産データ、受注データ、POSデータ等の膨大なデータから、購買客の購入傾向をみつけだす等に適用されています 。)データマイニング手法データマイニングの具体的な手法には知識工学、ニューラルネットワーク、フラクタル、パターン認識、ファジー理論、統計解析等がありますが、この中で統計解析は、最も代表的なデータマイニング手法です。 現在では、統計解析ソフトもいろいろ開発され、SPSS,STATISTICA、S、S-PLUS、JMP、KnowledgeSEEKER、JUSE/MA等がありますが、一般的に意外と知られていないのが、今回この講座で利用するExcelです。 Excelは、データマイニング・ツールであるばかりか、データウェアハウスの機能も兼備えているのです。 データウェアハウスデータマイニングとデータウェアハウスは切手も切離すことは出来ません。データを分析するにはデータがなければならないのですから。 データウェアハウスの特徴は何でしょう。 日次データ、月次データ等時系列データも取込むことも特徴の1つです。売上げデータ、顧客データ等企業にとって重要なデータが入っています。つまり、データの宝庫です。 データウェアハウスマシンの開発も進められ、実用機(三菱電機のDIAPRISM等)も出はじめました。膨大なデータを相手にするわけですから、マシンには高速処理(ハードウェアとアルゴリズム)が要求されます。DIAPRISMはこれを実現したプロセッサー(100万行を2秒で処理)として注目されています。 データウェアハウスおよびデータマイニングツールExcelデータウェアハウスの身近なものにExcelがあります。しかも、Excelは解析ツールおよび可視化(グラフ化)ツールも備えておりますので、立派なデータマイニングツールでもあるのです。Excelは、こんなに身近なソフトで優秀な機能を備えているにもかかわらず、その機能を十分に利用されていないのが現状なのです。ほとんどのパソコンにはExcelが、インストールされているので、数十万もするデータマイニングソフトを、新たに購入する必要もありません。ある程度の分析はExcelの機能で出来るのです。 ![]() Copyright(C)1999, Techno Consultants Inc. All rights reserved. |