簡単に言うと、データマートは範囲が限定されたデータウェアハウスであり、そのデータはデータウェアハウスからデータを要約して選択するか、またはソースデータシステムからの明確な抽出、変換、およびロードプロセスを使用して取得できます。
比較表
比較基準 | データウェアハウス | データ市場 |
---|---|---|
基本 | データウェアハウスはアプリケーションに依存しません。 | データマートは意思決定支援システムのアプリケーションに固有のものです。 |
システムの種類 | 集中型 | 分散化 |
データの形式 | 詳細な | 要約した |
非正規化の使用 | データはわずかに非正規化されています。 | データは非常に非正規化されています。 |
データ・モデル | トップダウン | 一気飲み |
自然 | 柔軟でデータ指向で長寿命。 | 制限的、プロジェクト指向、そして短命。 |
使用されているスキーマの種類 | 事実の星座 | スターとスノーフレーク |
建物のしやすさ | 作りにくい | 構築が簡単 |
データウェアハウスの定義
データウェアハウスという用語は、管理の意思決定プロセスを支援する、時変、サブジェクト指向、不揮発性、および統合されたデータのグループを意味します。 あるいは、さまざまなアプリケーションシステムの統合を可能にする唯一のサイトで、統一されたスキーマに格納されている、複数のソースから収集された情報のリポジトリです。 このデータが収集されると、長期間保存されるため、寿命が長くなり、 履歴情報へのアクセスが許可されます。
その結果、データウェアハウスは、データへの単一の統合インターフェースをユーザーに提供し、それを通してユーザーは意思決定支援照会を簡単に作成できます。 データウェアハウスは、データを情報に変換するのに役立ちます。 データウェアハウスの設計にはトップダウンアプローチが含まれます。
顧客、売上、資産、品目など、組織全体にわたる主題に関する情報を収集するため、その範囲は全社的です。 一般的には、 ファクトコンステレーションスキーマが使用されています。これは、さまざまな主題を網羅しています。 データウェアハウスは静的な構造ではなく、継続的に進化しています。
データマートの定義
データマートは、データウェアハウスのサブセット、または特定のユーザーセットに対応する全社規模のデータのサブグループとして呼び出すことができます。 データウェアハウスには、データウェアハウスの堅牢性を保証するために、データ図で永続的でなければならない、 部門別および論理的なデータマートがいくつか含まれています。 データマートは、ボトムアップアプローチを使用して設計された単一のタスクに集中する一連のテーブルです。
スター スキーマおよびスノーフレークスキーマは単一のサブジェクトモデリングに移行しているため、これらがデータマートで一般的に使用されています。 ただし、スタースキーマはスノーフレークスキーマよりも人気があります。 データソースに応じて、データマートは2つのタイプ( 従属データマートと独立データマート)に分類できます。
データウェアハウスとデータマートの主な違い
- データウェアハウスはアプリケーションに依存しませんが、データマートは意思決定支援システムのアプリケーションに固有のものです。
- データは、データウェアハウス内の単一の集中型リポジトリに格納されます。 反対に、データマートはデータをユーザー領域に分散して格納します。
- データウェアハウスには詳細な形式のデータが含まれています。 対照的に、データマートには要約され選択されたデータが含まれています。
- データウェアハウス内のデータはわずかに非正規化されていますが、データマートの場合は高度に非正規化されています。
- データウェアハウスの構築にはトップダウンのアプローチが必要です。 逆に、データマートを構築している間は、 ボトムアップアプローチが使用されます。
- データウェアハウスは、 柔軟で情報指向であり、かつての既存のものです。 それどころか、データマートは限定的でプロジェクト指向であり、存在は短くなります。
- ファクトコンステレーションスキーマは通常、データウェアハウスのモデリングに使用されますが、データマートスタースキーマはより一般的です。
結論
データウェアハウスは、エンタープライズビュー、単一の集中型ストレージシステム、固有のアーキテクチャー、およびアプリケーションの独立性を提供します。一方、データマートは、部門ビュー、分散ストレージを提供するデータウェアハウスのサブセットです。 データウェアハウスは非常に大きく統合されているため、失敗のリスクが高く、構築が困難です。 一方、データマートは構築が簡単で、関連する障害リスクも少なくなりますが、データマートは断片化する可能性があります。