膨大なデータを扱う現代ビジネスでは、情報処理や分析のスピードが求められます。これらの機能を備えたDWH(データウェアハウス)は、今後ますます重視されることが予想されます。一般的なデータベースとは何が違い、どのような導入効果を期待できるのでしょうか。
目次
DWH(データウェアハウス)とは?一般的なデータベースとの違い
DWH(データウェアハウス)とは、企業のシステムやクラウドから情報を取得し、分析しやすい形で保管するデータベースです。各部署のデータが目的別や時系列順に整理されるため、スムーズに全社的な経営分析ができます。
分かりやすい例としては、POSシステムから取得したデータの分析が挙げられます。日本全国に支店を構える企業では、膨大な商品データや販売データ、顧客データなどが毎日蓄積されます。DWHでは、このようなデータをまとめて瞬時に分析できるため、高度な経営判断を迅速に下しやすくなります。
なお、一般的なデータベースはあくまで「情報の保管」が目的であり、各システムから収集した生のデータが蓄積されます。システムによって形式が異なるため、データの整形や抽出作業をしないと高度な分析はできません。
データレイクやデータマートとの違い
企業がデータを保管するシステムには、他にも「データレイク」や「データマート」があります。一般的なデータベースも含めて、各システムの違いを整理しておきましょう。
システムの種類 | 保管されるデータ | 導入目的 |
---|---|---|
DWH | POSやERPなどから収集した情報 | 高度かつ迅速な分析 |
データベース | POSやERPなどから収集した情報 | データの保管や検索 |
データレイク | 動画なども含めたあらゆる情報 | データの保管 |
データマート | 特定用途に使う情報 | 必要なデータの抽出 |
DWHに保管できるのは、抽出・変換された整形データのみです。一方、データレイクには形式の制限がないため、メールや文書、CADデータなども保管できます。
また、データマートは分析対象を狭めたDWHであり、保管されるデータは必要最小限の情報のみで構成されています。
DWH(データウェアハウス)の主要機能
DWHの主要機能には、データの整理や重複排除、統合があります。また、古い情報も整理された状態で保管されるため、今後に向けた経営分析だけではなく、経営計画と実績の比較にも使えます。
活用のイメージをつかむために、以下では主要機能を一つずつ見ていきましょう。
収集データをサブジェクト別に整理
DWHは単にデータを収集するのではなく、サブジェクト別に整理した上で保管します。製造プロセスを例に挙げると、「原材料」や「時間」などの項目別に整理されるため、データを一つの情報群として扱えるようになります。
近年ではDXの影響で、さまざまな部署・業務に基幹系システムが導入されています。製造業ではMESやERPなどが見られますが、システムが異なると同じ形式のデータは収集できません。
全社的な経営分析を行うには、収集したデータの整形・整理が必要です。DWHはこの役割を担っており、基幹系システムなどと連携をすることで、データの収集から分析までをスムーズ化できます。
データの重複排除と統合
経営分析の精度を高めるために、DWHにはデータの重複排除や統合をする機能も備わっています。
店舗間や部署間でデータを収集・共有する場合は、重複した情報も含まれてしまいます。このようなデータは分析対象に値しないため、そのままの状態では高度な経営分析ができません。
<重複したデータの例>
・「社員」「スタッフ」の項目で、同じ従業員が登録されている
・「企業名」「会社名」の項目で、同じ取引先が登録されている
・現場の作業員が、同じ顧客のデータを入力してしまった
同一の分析対象が含まれている場合は、不要なデータを削除した上で統合する必要があります。DWHにはこの機能が備わっているため、複数の基幹系システムを導入している企業であっても、整合性の高いデータベースを作成できます。
過去データを時系列で記録・整理
DWHでは過去の膨大なデータが記録され、かつ時系列順に整理されます。売上や顧客情報などの推移がひと目で分かるため、経営の大まかな流れを簡単に把握できるでしょう。
一般的なデータベースは最新情報を重視しており、古い情報はストレージを節約するために削除されます。例えば、顧客情報では「現住所」や「現在の会員ランク」などが保管されるので、これまでの推移を含めた分析には限界があります。
一方、DWHでは過去を含めたデータを分析するために、より大きなストレージ容量が確保されています。
DWH(データウェアハウス)を導入する3つのメリット
DWHはビッグデータを使った分析や、横断的な経営分析を可能にするシステムです。一般的なデータベースも分析に活用されていますが、DWHを導入するとデータを活用する幅がさらに広がります。
具体的にどのようなメリットがあるのか、特に押さえたい点を確認していきましょう。
1.経営分析の精度が上がる
ここまでの内容を踏まえて、まずはDWHの特徴を整理しておきましょう。
<DWHの特徴>
・必要なデータを効率的に収集できる
・不要な重複データを排除する
・データがサブジェクト別または時系列順に整理される
・過去も含めて膨大なデータを保管できる
簡単にまとめると、DWHでは一貫性や整合性のあるビッグデータが形成されるため、経営分析の精度が上がります。データを収集するためのデータベースやデータレイク、BIツール(※)などと連携をすれば、より効率的に分析結果を得られるでしょう。
(※)「Business Inteligence」の略。高度なデータ分析やレポート作成などの機能がある。
2.意思決定のスピードが上がる
DWHのパッケージ製品には、正しい経営判断をするための分析機能や、用途に合った整形データを出力する機能が備わっています。以下のような作業を省けるため、DWHは迅速な意思決定に役立ちます。
<DWHの導入で省ける作業>
・各システムから収集したデータの整形
・矛盾したデータの特定や排除
・分析対象となるデータの抽出
・保管するデータの並べ替え
また、DWHはクラウド化が進んでおり、製品によってはストレージ容量を調整できます。このような製品を選べば、ストレージ容量を節約するためのデータ管理も必要ありません。
3.データがほぼ永続的に保管される
原則として、DWHでは保管されたデータが更新・削除されることはありません。時系列順のデータがほぼ永続的に保管されるため、常にビッグデータをもとにした分析が行えます。
ただし、ストレージ容量が限界に達したら、優先度の低いデータを圧縮したり削除したりする必要があります。このようなメンテナンスを省きたい場合は、容量を追加購入できるクラウド型の製品を選びましょう。
DWH(データウェアハウス)はどう活用する?システム選びのポイント
DWHの活用方法には、「CRMとの併用」と「BIツールを使った経営分析」があります。
<CRMとの併用>
顧客管理に使用されるCRM(Customer Relationship Management)は、DWHとの相性が良いシステムです。これらを併用すると、あらゆる顧客情報を時系列順で記録できるため、消費行動やニーズの分析に役立ちます。
<BIツールを使った経営分析>
一般的なBIツールには、専門的な分析機能や多次元分析機能が備わっています。これらの機能とDWHを組み合わせれば、データの整形や整理、高度な経営分析までをスムーズに行えます。
DWHの導入効果を最大化するには、他のシステムとの兼ね合いを意識して、目的に合ったシステムを選ぶことが重要です。DWHにもさまざまな製品があるため、費用対効果の高いものを選ばなければなりません。
どのような点を重視すれば良いのか、ここからはシステム選びのポイントを解説します。
特に優先したいのは「データ処理速度」
ここまで解説したように、DWHは高度な経営分析をスムーズに行うシステムです。そのため、データの読み込みや並べ替えに時間がかかるようでは、大きな導入効果は期待できません。
高速処理を重視している製品は、PB(ペタバイト)以上のデータセットに対応しています。収集・管理するデータ容量に合わせて、十分なデータ処理速度のある製品を選びましょう。
なお、経営分析まで高速化するには、BIツールの処理速度にもこだわる必要があります。
機能面やコスト面から「提供形態」を選ぶ
企業が導入するシステムは、自社サーバーを用いる「オンプレミス型(ホスト型)」と、オンライン上でサービスを利用する「クラウド型」に大きく分けられます。具体的にどのような違いがあるのか、以下で簡単に紹介しましょう。
主な違い | オンプレミス型 | クラウド型 |
---|---|---|
自社サーバー | 必要 | 不要 |
導入コスト | 高い | 低い |
システムの運用管理 | 必要 | 不要 |
アップデート | 自社で対応 | サービス提供者が対応 |
カスタマイズ性 | 高い | 低い |
セキュリティ性 | 高い | 低い |
自社サーバー内の基幹系システムと連携したい場合や、セキュリティ性にこだわりたい場合はオンプレミス型が向いています。ただし、導入のためのインフラ整備や運用管理に手間がかかるため、十分なコスト・人材を確保しておく必要があります。
一方で、クラウド型では導入コストを抑えられますが、カスタマイズには限界があります。予算だけではなく、将来的に追加する機能やセキュリティ面も踏まえて、自社に合った提供形態を選びましょう。
なお、DWHには専用のハードウェアにシステムやストレージを統合した製品(アプライアンス)も存在します。アプライアンスは強固なセキュリティを備えていますが、オンプレミス型よりも拡張性が低い傾向にあります。
使いやすさに関わる「拡張性や柔軟性」
DWHは運用期間が長いほど、蓄積されるデータも膨大になります。経営分析の観点では、過去のデータも極力残すことが望ましいため、「ストレージ容量を拡張できるか」は事前に確認しておきましょう。
また、DWHは経営分析だけではなく、業務に必要なデータを参照するときにも活用されます。つまり、現場の作業員も使用者となるため、ユーザーインターフェースの柔軟性にもこだわる必要があるでしょう。
使いやすく、かつ見やすい操作画面にカスタマイズできれば、事業環境が変わったときにも素早く対応できます。
外部のアプリケーションやデータとの「連携性」
前述のCRMやBIツールをはじめ、DWHは他のアプリケーションとの相性が良いシステムです。組み合わせによっては、データ収集から経営分析までを自動化できますが、実は必ずしも連携できるとは限りません。
例えば、DWHとBIツールでデータ形式が異なると、フォーマット変換などの手間がかかります。データ収集からシステムを導入する場合は、データベースやデータレイクとの互換性も確認する必要があるでしょう。
DWHはあくまで中間的なツールであることを理解し、システム全体の連携性を意識することが重要です。
DWH(データウェアハウス)の主要製品と比較表
DWHを選ぶ際には、実際の製品を比較することも必要です。上記のポイント以外にも、ベンダーによって細かい仕様や料金などは異なります。
以下では主要製品の特徴をまとめたので、導入環境や目的を意識しながら比較してみましょう。
製品名 (提供形態) | 料金体系 | 主な特徴 |
---|---|---|
Amazon Redshift (クラウド型) | 0.25ドル~/1時間 | ・機械学習モデルが自動で作成される ・自動最適化による処理速度の向上 ・データレイクなどの拡張機能がある |
AnalyticMart (オンプレミス型、クラウド型) | データ量で変動、または年額ライセンス | ・1億件を3秒で処理する高速検索 ・BIツールとの連携機能がある ・データを最大40分の1に圧縮 |
Azure Synapse Analytics (クラウド型) | データ量で変動 | ・データの移動なしで分析可能 ・BIツールなどの連携機能がある ・暗号化やマスキングによるセキュリティ強化 |
BigQuery (クラウド型) | データ量で変動、または月額プラン | ・目的に合った機能セットを選べる ・データレイクなどの拡張機能がある ・各システムのデータ管理や検出、モニタリングを一元化できる |
IBM Db2 Warehouse on Cloud (クラウド型) | データ量で変動 | ・SQLなどによる機械学習モデルを搭載 ・専門家チームによるセキュリティサポート ・災害に備えてデータがバックアップされている |
Metaps Analytics (クラウド型) | データ量で変動または月額プラン | ・アプリ内のユーザー行動をデータ化できる ・広告効果や市場データを分析できる ・push通知など、ユーザーへのアプローチが可能 |
Smart DWH (クラウド型) | 月額15万円+クラウド利用料 | ・データ収集の設定情報を自動で収集 ・ラべリングによる検索効率化 ・エラー通知やバックアップなどのサポート |
SOFIT Super REALISM (クラウド型、アプライアンス型) | 月額プラン | ・Excelと同じ感覚で操作できる ・世界最高速レベルの処理速度 ・納品前に基本設定まで代行 |
Trocco (クラウド型) | 月額10万円~ (無料プランあり) | ・外部ツールとのAPI連携機能がある ・Webユーザーの行動データを収集できる ・専任の担当者が運用やトラブル対応をサポート |
YDC SONAR (クラウド型、オンプレミス型) | 記載なし(要問い合わせ) | ・製造現場に特化したモジュールを搭載 ・製造プロセス管理やレポート作成機能を拡張できる ・ノーコードで機械学習やAI分析を実装できる |
一部の製品を除き、DWHの導入コストは企業によって変わります。搭載する機能やデータ量に左右されるため、基本料金だけで比較することはできません。コストを極力抑えたい場合は、各社に問い合わせて細かい見積もりを取ってもらいましょう。
また、製品によっては無料プランやトライアル期間が用意されています。DWH自体の活用が難しい可能性もあるので、実際の使用感を確かめてから契約することも検討してみてください。
自社に合ったDWH(データウェアハウス)を探してみよう
DWHは、高度かつスムーズなデータ収集や経営分析のために導入するものです。中小企業でもビッグデータを構築・管理できるので、すでにデータベースを利用している企業にも利用価値があります。
ただし、製品によって料金面や機能性が異なる点には注意しなければなりません。全社的なDXに取り組んでいる場合は、他のシステムとの連携性も確認する必要があるでしょう。
本記事で紹介したポイントを押さえて、自社に合った製品を探してみてください。
【こんな記事も読まれています】
・【会員限定動画】サプライウェブで実現するマスカスタマイゼーション時代の企業戦略
・製造業における購買・調達業務とは?課題の解決方法も紹介
・ビジネスや技術のトレンドに反応しながら進化を続けるCRMの事例を紹介