組織のデータは、最も価値のある資産です。
ビジネスの成功にとって、データ分析とレポート作成は極めて重要です。しかしビッグデータは、これまで大きな負担を要するものでした。大量のデータを企業内に保持することの欠点は、データベースのパフォーマンスに影響を与えることです。ビッグ・データ・プロジェクト、レポート、臨時クエリなどのためにデータにアクセスする必要がある場合、本番環境システムでI/Oの競合が発生します。こうなると、データベースのパフォーマンスが大幅に低下します。つまり、生産性が失われ、エンドユーザはフラストレーションを感じ、収益に悪い影響を及ぼすということです。
では、データベースのパフォーマンスに影響を与えずに、本番環境のデータベースにアクセスするにはどうすればよいでしょうか。
予算をかけたハードウェアのアップグレードや、レポート作成と分析専用のデータベースをいくつか用意することも、よいアイディアのように見えるかもしれません。ただし、そのような手法では、運用コストは増大する一方です。ビジネスにとって重要なデータへのアクセスに対し、より手頃で、他に影響を与えない手法が必要です。
レポート作成と分析のオフロードが必要です。
レポート作成と分析をオフロードすることにより、データベースのパフォーマンスを犠牲にすることなく、手頃なコストで簡単にデータの可能性をフル活用することができます。データレプリケーションを利用することで、レポート作成を別個のシステムにオフロードできます。分析専用データベースの購入やメンテナンスは不要です。この手法により、オンラインのトランザクション処理とデータベースのレポート作成を分割し、継続的にメンテナンスされ、本番環境システムのアクティビティを反映するデータ・ウェアハウス・インスタンスに送ることができます。つまり、ビジネスユーザとデータサイエンティストは、データベースの競合を発生させることなく、リアルタイムの正確なデータを基に分析やレポート作成を行うことができるのです。この手法は、その他の多数のシナリオにも役立てることができます。