データマイニングとデータウェアハウスの違い
データマイニングとデータウェアハウス
データマイニングとデータウェアハウスは、データを分析するための非常に強力で一般的な技術です。統計に傾いているユーザーは、データマイニングを使用します。彼らは統計モデルを利用して、データの隠れパターンを探します。データマイナーは、異なるデータ要素間の有用な関係を見つけることに関心があり、最終的にはビジネスにとって有益です。しかし一方で、ビジネスの規模を直接分析できるデータ専門家は、データウェアハウスを直接使用する傾向があります。
データマイニングは、知識発見(KDD)としても知られています。上述したように、これはコンピュータ・サイエンスの分野であり、未知の興味深い情報を生データから抽出することを扱う。ここ数十年でパターンの手動抽出が不可能になったように、データマイニングはビジネスのような分野で指数関数的に増加しているため、膨大なデータをビジネスインテリジェンスに変換する非常に重要なツールとなっています。例えば、現在のところ、ソーシャルネットワーク分析、詐欺検出、マーケティングなどのさまざまなアプリケーションに使用されています。データマイニングは、通常、クラスタリング、分類、回帰、および関連付けの4つのタスクを処理します。クラスタリングは、非構造化データから同様のグループを識別します。分類は、新しいデータに適用できる学習ルールであり、通常、データの前処理、モデリングの設計、学習/機能の選択、評価/検証のステップを含みます。回帰は、モデルデータに対して最小限の誤差で関数を見つけることです。そして協会は変数間の関係を探しています。データマイニングは、通常、ウォルマートで来年の高い利益を得るのに役立つ主要製品のような質問に答えるために使用されますか?
<!前述のように、データウェアハウスはデータの分析にも使用されますが、ユーザーの設定が異なり、少し異なる目標があります。たとえば、小売分野の場合、データウェアハウジングユーザーは、顧客の中でどのような種類の購入が一般的であるかをより重視しているため、分析結果は顧客体験を向上させて顧客を助けることができます。しかし、データマイナーはまず、顧客が特定のタイプの製品を購入し、その仮説をテストするためにデータを分析するという仮説を推測します。データウェアハウスは、ニューヨークの店舗がシカゴの店舗よりもはるかに早く小さなサイズの在庫を販売していることを後で知るために、同じサイズの製品を最初に購入した大手小売業者が行うことができます。だから、この結果を見ることで、小売店はシカゴの店舗に比べて小さいサイズのニューヨーク店を買うことができます。<!あなたがはっきりとわかるように、これらの2つのタイプの分析は、肉眼と同じ性質のように見えます。どちらも、過去のデータに基づいて利益を増やすことに懸念があります。もちろん、重要な違いがあります。簡単に言えば、データマイニングとデータウェアハウジングは、さまざまなタイプのアナリティクスを提供することに専念していますが、異なるタイプのユーザーには間違いありません。言い換えれば、Data Miningは統計的仮説をサポートする相関関係、パターンを探します。しかし、データウェアハウスは比較的幅広い質問に答え、将来の改善方法を認識するためにそこからのデータをスライスして切り出します。