以下に示す比較表を使用して、データマイニングとデータウェアハウスの違いを確認しましょう。
比較表
比較基準 | データマイニング | データウェアハウス |
---|---|---|
基本 | データマイニングは、データベース/データウェアハウスから意味のあるデータを取得または抽出するプロセスです。 | データウェアハウスは、複数のソースからの情報が単一のスキーマの下に格納されているリポジトリです。 |
データマイニングの定義
データマイニングは、 データベースに存在し ないと思われる 知識を発見するためのプロセスです。 従来のクエリツールを使用すると、データから既知の情報のみを取得できます。 しかし、データマイニングは、データから隠された情報を取得する方法を提供します。 データマイニングは、 意思決定に使用できる意味のある情報をデータベースから抽出します。
KDDと呼ばれるデータベース内の知識発見は、 関係とパターンを示します 。 関係は、2つ以上の異なるオブジェクト間、同じオブジェクトの属性間でもよい。 パターンはデータマイニングのもう1つの結果であり、意思決定に役立つ定期的でわかりやすい情報のシーケンスを示します。
KDD、すなわちデータベースにおける知識発見に含まれるステップは、最初に、データマイニングを実行しなければならないデータセットの選択として要約することができる。 次は矛盾するデータの削除を含む前処理です。 次に、データがデータマイニングに適した形式に変換されるデータ変換が行われます。 次はデータマイニングです 。ここではデータマイニングアルゴリズムがデータに適用されます。 そして最後に、データ間の関係やパターンを抽出することを含む解釈と評価 。
データマイニングは、データを集約および要約して格納しているデータウェアハウス環境に適しています。 データウェアハウス内のデータをマイニングすることが容易になるので
データウェアハウスの定義
データウェアハウスは、 複数のソースから収集された情報が単一の統一されたスキーマの下に格納されている中心的な場所です。 データは最初に収集され、さまざまな企業のソースがクリーンアップされて変換され、データウェアハウスに格納されます。 データがデータウェアハウスに入力されると、データは長期間そこに残り、時間外にアクセスされる可能性があります。
データウェアハウスは、 データモデリング、データ取得、データ管理、メタデータ管理、開発ツールストア管理などのテクノロジの完璧な融合です。 これらのテクノロジはすべて、 データ抽出、データ変換、データ保存などの機能をサポートし、データにアクセスするためのユーザーインターフェイスを提供します 。
データウェアハウスは製品やソフトウェアではなく、情報環境であり、企業の統合ビューのような情報を提供します。 あなたは意思決定に役立つ企業の現在および過去のデータにアクセスすることができます。 運用システムに影響を与えることなく、意思決定のために行われたトランザクションをサポートします。 戦略的情報を入手するための柔軟なリソースです。
データマイニングとデータウェアハウスの主な違い
- データマイニングとデータウェアハウスを区別する基本的な違いは、データマイニングは大規模なデータベースまたはデータウェアハウスから意味のあるデータを抽出するプロセスです。 ただし、データウェアハウスは、データが統合された形式で格納される環境を提供します。これにより、データマイニングが容易になり、データをより効率的に抽出できます。
結論:
データマイニングは、十分に統合された大規模データベース、つまりデータウェアハウスがある場合にのみ実行できます。 そのため、データマイニングの前にデータウェアハウスを完成させる必要があります。 データ・マイニングが効率的に知識を抽出できるように、データウェアハウスは統合された形式の情報を持っていなければなりません。