ホワイト ペーパー シスコ データ仮想化ソリューション を使用したデータ抽 象化のベスト プラクティス 概要 昨今の企業は、情報資産へのアクセスを容易にすることにより、全体的な収益性の向上、コストの削減、およ びリスクの軽減を図る方法を模索しています。複雑で多様な大量のデータがさまざまなテクノロジーやアプリ ケーション サイロに分散されているため、こうした目的を実現することは難しくなっています。さらに、ソースごと にアクセス メカニズム、構文、セキュリティが異なることや、ビジネス ユーザやアプリケーションによる使用と再 利用のための構造の欠如、不完全なデータや重複するデータ、遅延問題の混在など、幅広い問題が状況を複 雑にしています。 データ抽象化は、データのネイティブの構造と構文を、アプリケーション開発者にとって使いやすいビューや データ サービスに変換することで、こうした問題を解決します。データ抽象化には、手動によるデータ抽象化、 データ ウェアハウス スキーマの作成、およびデータ仮想化という 3 つの方法で取り組むことができます。これ ら 3 つのアプローチの中で、データ抽象化に最適なソリューションはデータ仮想化です。データ仮想化は柔軟 性と俊敏性に最も優れ、さまざまなデータの場所やソースからリアルタイムにすばやくデータを取得することが できるためです。 Cisco Data Virtualization は、データ リファレンス アーキテクチャを形成するさまざまなレイヤで構成され、 データを利用する複数のアプリケーションをサポートします。このアーキテクチャは、Forrester と Gartner が打 ち出した、アナリストによるデータ仮想化のベスト プラクティスと軌を一にしています。ここでは、適切なデータへ のオンデマンド アクセス、俊敏性と効率の向上、エンドツーエンドの制御の維持、すべてのデータ リソースでの データのセキュリティの向上を実現する、Cisco Data Virtualization を使用したデータ抽象化のベスト プラク ティスについて説明します。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 1/ 1 ビジネスと IT が直面するデータ管理の課題 複雑で多様な大量のデータがさまざまなアプリケーション サイロに分散されている状況において、データへの アクセスはますます困難になっています。このように大規模に分散された多様なデータは、コスト削減やリスク 緩和においても障害になります。アクセス メカニズム、構文、セキュリティがソースごとに異なることや、ビジネ ス ユーザやアプリケーションによる使用や再利用のための構造の欠如、不完全なデータや重複するデータ、 遅延問題の混在などの幅広い問題には、シンプルなデータ アクセスを可能にするデータ管理ソリューションが 必要です (図 1 を参照)。 図 1. データ抽象化の課題 データ抽象化による課題の解決 データ抽象化は、データをそのネイティブな構造と構文からアプリケーション開発者が理解および使用しやすい再 利用可能なビューやデータ サービスに変換することで、ソース データとコンシューマ間のギャップを解消します。 現在利用できるデータ抽象化アプローチには、次のようなものがあります。 手動によるデータ抽象化:企業によっては、Java でデータ抽象化を手動で構築したり、ビジネス プロ セス管理(BPM)ツールを使用します。しかし、これらの方法は柔軟性や効率性に欠けることがよくあ ります。また、こうしたアプローチには、データ コンシューマの厳しいパフォーマンス要求を満たすため に必要な、堅牢なフェデレーションやクエリ最適化機能が欠けているため、大容量のデータ セットには 適していません。 データ ウェアハウス スキーマ:ディメンション、階層、ファクト、その他のデータ編成に関するデータ モ デリング戦略を文書化します。しかし、データ ウェアハウジング アプローチは、コスト高となり、俊敏性 にも欠けます。また、データ ウェアハウス ベースのスキーマには、データ ウェアハウス外に存在する多 くの新しいデータ グループ(ビックデータ、クラウド データ、外部データ サービスなど)は含まれません。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 2/ 9 データ抽象化に最適なソリューションとしてのデータ仮想化 データ仮想化は、データ抽象化の実装に最適な方法です。エンタープライズ アーキテクチャの視点から、シス コ データ仮想化 ソリューションはセマンティック抽象化(データ サービス レイヤ)を構築して、複数のアプリケー ションによる利用をサポートします。再利用可能なサービスで構成される中間レイヤは、基盤となるソース デー タ レイヤとデータを利用するソリューション レイヤとを切り離します。これにより、最も効果的な方法で各レイヤ を処理するために必要な柔軟性に加え、アプリケーション、スキーマ、または基盤となるデータ ソースの変更に すばやく対応する俊敏性も得ることができます (図 2 を参照)。 図 2. Cisco Data Virtualization を使用したデータ抽象化 データ仮想化によるデータ抽象化を利用して、次のような目標を達成することができます。 適切なビジネス情報を適切なタイミングで提供:複数の多様なデータ ソースをまとめてリンクし、リア ルタイムで配信することにより、すべての情報ニーズにオンデマンドで対応します。 ビジネスおよび IT モデルの調整:エンタープライズ情報モデルまたは論理ビジネス モデルを使用して アプリケーション全体の俊敏性、効率性、および再利用性を向上させます。正規モデルとして知られる この抽象化アプローチにより、データの複雑さ、構造、および場所の問題を解決できます。 ビジネスと IT の変更の分離:アプリケーションをソース データの変更から、また、ソース データをアプ リケーションの変更から分離します。開発者はより安定したデータ ビューに基づいてアプリケーション を作成することができるため、物理データ ソースの変更や場所の変更がコンシューマに影響すること はありません。 エンドツーエンドの制御:1 つのプラットフォームを使用して、複数のソースとコンシューマを対象とする、 データ アクセスと配信プロセスの設計、開発、管理、および監視を行います。 安全性の高いデータ:統合されたセキュリティ メソッドおよびコントロールにより、すべてのデータ ソー スとコンシューマにデータ セキュリティ ルールを一貫して適用します。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 3/ 9 Cisco Data Virtualization のデータ抽象化リファレンス アーキテクチャ 図 3 に、データ抽象化リファレンス アーキテクチャを形成するレイヤの概要を示します。アーキテクトとアナリス トは、データ仮想化プラットフォームを使用してデータを抽象化する際にこの図を参考にすることができます。 図 3. Cisco Data Virtualization のデータ抽象化リファレンス アーキテクチャ このリファレンス アーキテクチャに含まれるレイヤは次のとおりです。 データ コンシューマ:クライアント アプリケーションは、それぞれが認識できるさまざまな形式およびプ ロトコルでデータを取得する必要があります。Cisco Data Virtualization は、SOAP、REST、JDBC などの標準的な方法を使用してデータをコンシューマに配信します。 アプリケーション レイヤ:アプリケーション レイヤは、ビジネス レイヤを各コンシューマが必要としている アプリケーション形式にマッピングします。たとえば、Web サービスの場合は XML 形式にしたり、コン シューマがデータを参照する方法に合わせてさまざまなエイリアス名を持つビューを作成したりできます。 ビジネス レイヤ:ビジネス レイヤは、ビジネスには顧客や製品などの主要なビジネス グループを表す ための標準または規範的な方法があるという考えに基づいて作成されています。たとえば金融業界で は、金融商品または発行者に従って情報にアクセスすることがよくあります。一般的に、データ モデ ラーはビジネス専門家やデータ プロバイダーと協力してこれらのビジネス グループを表す「論理」また は「正規」ビューのセットを定義します。これらのビューは、事業部門をまたぐ複数のコンシューマが使 用でき、また、使用する必要がある再利用可能なコンポーネントです。 物理レイヤ:物理レイヤは基になるデータ ソースへのアクセスを提供し、物理メタデータとフォーマット ビューを統合して物理から論理へのマッピングを実行します。 o 物理メタデータ:物理データ ソースからインポートされ、データ抽象化レイヤでマッピング機能 を実行するために必要なメタデータをオンボードするために使用されるデータ。「現状のまま」 保持されるレイヤであるため、グループ名と属性はこのレイヤでは変更されません。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 4/ 9 o フォーマット ビュー:このビューにより、物理名を論理名にエイリアス化して物理メタデータを データ仮想化レイヤにマッピングできます。フォーマット ビューにより、値のフォーマット、デー タ型キャスティング、派生列、軽量データ品質マッピングなどのシンプルなタスクを簡単に実 行できます。このレイヤは物理ソースから生成され、物理ソース属性と対応する「論理/正規」 属性名間の 1 対 1 のマッピングを行います。また、物理ソース ビューと論理ビジネス レイヤ ビュー間のバッファとしても機能します。したがって、有効な場合はこのレベルにキャッシュが 導入される場合があります。導入時の異なる物理ビューへの再バインドは、これらのビューの もう 1 つの役割です。命名規則は非常に重要で、このレイヤに導入されます。 データ ソース:データ ソースは、組織内外に存在する物理情報資産です。これらの資産には、データ ベース、SAP などのパッケージ化されたアプリケーション、Web サービス、Excel スプレッドシートなど があります。 Forrester データ仮想化ビジョンの実現 Forrester Research は、その『Data Virtualization Reaches Critical Mass(データ仮想化はクリティカル マス に達する)』レポートでデータの抽象化に関する次のガイダンスを提供しています。 1 0F0 F Forrester によると、最も成功しているデータ仮想化実装では階層型アーキテクチャが使用されており、これに より社内の各領域の異なるパフォーマンス要件に合わせて物理および仮想データ ストアを適切なレベルで組 み合わせることができます。正規ビジネス モデルを通じてさまざまなソース データのマッピングをファネリング することで、砂時計型のアーキテクチャが作成されます。 アーキテクチャの中間で正規モデルを使用する以外に、注意すべき点として、効果的なデータ抽象化の 2 つ の重要な特性があります。1 つは、物理データ ソースは実際のデータに近いステージング レイヤに配置される 傾向にある一方、データがエンド ユーザに近くなるほど仮想データが増えるという点です。2 つ目は、最終的な 仮想マッピング レイヤにより、データが正しい形式でコンシューマに提供されるという点です (図 4 を参照)。 図 4. Forrester Research 『Data Virtualization Reaches Critical Mass(データ仮想化はクリティカル マスに達する)』 Forrester と Cisco Data Virtualization のベスト プラクティス アーキテクチャ(図 5 を参照)には非常に類似し ている点があります。 1 Brian Hopkins 著(2011 年)『Data Virtualization Reaches Critical Mass(データ仮想化はクリティカル マスに達する)』 Forrester。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 5/ 9 図 5. Forrester と Cisco Data Virtualization のベスト プラクティス アーキテクチャの比較 Gartner のデータ統合規範の実現 2005 年以降、Gartner はより広範囲なビジネスおよび IT の進化に関連付けてデータ サービスの概念を調査 2 しています。Gartner は最近開催された Business Intelligence Summit で「データ統合の規範」 について 語っています(図 6 を参照)。 1F1F 図 6. Cisco Data Virtualization のデータ抽象化アーキテクチャによる Gartner のデータ統合規範の実装 Gartner によると、データ統合には、データへの一貫したアクセスを行うために使用する手法、アーキテクチャ 技法、およびツールが含まれ、これらはデータ構造のタイプやグループに関係なく、アプリケーションやビジネ ス プロセスの要件を満たすために必要となります。データ統合機能は、情報に焦点を当てたインフラストラク チャの重要部分であり、BI およびパフォーマンス管理をサポートするデータの調整と配信を促進します。データ に関する新たな課題により、世界中でデータ統合への投資が急増しています。市場投入の迅速化やビジネス プロセスでの俊敏性の向上などのビジネス要因により、企業はデータをこれまでとは異なる方法で管理するよ うになっています。これらのイニシアティブを実現するため、企業はデータの可視性を向上させてパフォーマン スや運用を的確に把握できるようにする必要があります。 2 Ted Friedman 「Advancing your Data Integration Competency in Support of Analytics(分析をサポートするデータ統合能力の促進)」。 Business Intelligence Summit でのプレゼンテーション。Gaylord Convention Center(テキサス州 Grapevine)。Gartner Research. Inc. © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 6/ 9 データ仮想化のデータ抽象化リファレンス アーキテクチャを使用して、Gartner の提唱する「データ統合規範」 を次のように実装できます。 手法:Cisco Data Virtualization は、データ仮想化を組織に導入する際のベスト プラクティスを形成し、 業界をリードする IT アナリストやシステム インテグレータの推奨手法に影響を与えてきました。この ソート リーダーシップと実績により、確信を持ってデータ仮想化を組織に導入することができます。 アーキテクチャ技法:Cisco Data Virtualization Plan and Build Service は、ユーザがデータ仮想化 ソリューションを設計する際に役立つ豊富な知識とスキルを提供します。このサービスには、顧客がプ ロジェクトの立ち上げと運用を迅速に行い、利益を最大化するために役立つアーキテクチャ技法が含 まれています。顧客には、アーキテクチャ技法のブループリントとして使用される『Data Abstraction Best Practices Technical Guide(データ抽象化ベスト プラクティス技術ガイド)』が提供されます。 ツール:データ仮想化プラットフォームには、Gartner が提唱する「データ統合規範」を実装するための 完全な実証済みツールが用意されています。 ビジネス コンテキスト サービス:データ仮想化のリファレンス アーキテクチャにおいて、アプリケーショ ン レイヤはビューまたは Web サービスをアプリケーションのコンテキストでマッピングおよび公開する ためのメカニズムを提供します。アプリケーション レイヤは Gartner ではビジネス コンテキスト サービ スに相当します。アプリケーションのコンシューマに対しては、さまざまなプロトコルを使ったデータ配 信が必要です。データ仮想化リファレンス モデルでは、データ コンシューマは JDBC、ODBC、 SOAP/HTTP、REST、ADO/.Net などのさまざまな標準プロトコルを使用して必要なデータにアクセス します。これらの標準プロトコルは、Gartner が規定するとおり、BI、MDM、Web サービス API、およ びエンタープライズ オブジェクト コンシューマをサポートします。 セマンティック/論理サービス:Gartner の「セマンティック/論理」サービスは、物理モデルを情報のビジ ネス コンテキスト ビューに変換するためのサービスです。「論理」および「セマンティック」という言葉は しばしば「正規」を意味します。これは、ビジネスの共通データ辞書を定義する方法です。このデータ辞 書の用語や属性は意味が似ているエンティティにグループ分けされます。データ仮想化は、次の フォーマット ビューでこれらのニーズをサポートします。 データ操作サービス:Gartner の「操作」機能にはアクセス、保存、および配信が含まれ、これらは データ仮想化の物理レイヤと一致します。ここでは、イントロスペクション、ディスカバリ、およびソース データ アクセス ツールによって物理レイヤにアクセスします。データ仮想化はアクセスを提供する データ ソースの範囲を、リレーショナル 、サービス指向、ファイル、パッケージ化されたアプリケーショ ン、ビッグデータと、徐々に増やしています。 最適化:Gartner とシスコは両者とも、最適化はソースからコンシューマに至るまで、設計の間も実行 の間もアーキテクチャ全体に及ぶものと見なしており、これはデータ仮想化のオプティマイザの動作と 完全に一致しています。 論理データ ウェアハウスに関する最近の Gartner の調査によれば、このガイダンスは拡張および強化されて います。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 7/ 9 主なメリットのまとめ データ抽象化は、ビジネス ニーズとソース データとの間に本来存在している形式上のギャップを埋めます。 Cisco Data Virtualization のこのベスト プラクティスを実装すると、次のようなメリットがあります。 情報アクセスのシンプル化:ビジネス、IT 用語、およびテクノロジーを結んで成功に導きます。 データの共通ビジネス ビューの生成:エンタープライズ情報モデルまたは「正規」モデルを使用してア プリケーション全体の俊敏性、効率性および再利用性を向上させます。 正確なデータの提供:データ品質と検証ルールをすべてのデータ ソースに一貫して適用します。 安全性の高いデータの提供:統合されたセキュリティ フレームワークを使用して、データ セキュリティ ルールをすべてのデータ ソースとコンシューマに一貫して適用します。 エンドツーエンドの制御の向上:データ仮想化を使用して、複数のソースおよびコンシューマを対象と する、データ アクセスと配信を一元的に管理します。 ビジネスと IT の変更の分離:アプリケーションをソースの変更から、また、ソースをアプリケーションの 変更から分離します。ビジネス ユーザとアプリケーション開発者はより安定性の高いデータ ビューを 使用して作業できます。IT は情報の利用者に影響を与えずに、物理データ ソースの変更と場所の変 更を継続的に行うことができます。 次のステップ 企業はいくつかの簡単なステップを実行するだけで前述した俊敏性と TOC という主なメリットを得ることができ ます。学習と導入を進めるために、管理可能なプロジェクトを迅速に開始することが重要です。 実現可能な目標を設定する:専門のチームを立ち上げ、プロジェクトを開始します。成功したら、ビジネ スと IT チームの関与を拡大し、エンタープライズレベルの完全な導入に向けて各部門に展開します。 抽象のレベルを決定する:4 つの推奨レイヤは組織に適していますか。1 つ以上のレイヤ内でさらな る分化が必要ですか。Cisco Data Virtualization Plan and Build Service を使うと、これらの質問に 回答し、適切な方法で開始することができます。 モデリングおよびマッピング アプローチを決定する:トップダウン方式、ボトムアップ方式、またはその 両方のうち、どれを採用しますか。 o トップダウン方式:ビジョンを設定し、そのビジョンを実現するためのデータを特定する必要が あります。これはコントラクトファースト デザインと呼ばれることがよくあります。このアプロー チでは、データ仮想化により独自の WSDL から開始して、データ仮想化サービスをコントラク トにマッピングすることができます。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 8/ 9 o ボトムアップ方式:データがどのようなものか把握していても、それを他の人がどのように使用 できるかを判断する必要があります。このアプローチでは、SQL ビューや Web サービスなど のリソースをデータ仮想化によりイントロスペクトされたソースから直接生成または公開でき ます。 o 両方:ドメインやニーズに応じて両方を組み合わせます。 すぐに開始する:分析に過剰な時間をかけないでください。小さなステップからすぐに始めることが、学 習、前進、および価値の獲得のために最適な方法です。 詳細情報 Cisco Data Virtualization の詳細については、シスコの担当者に問い合わせるか、 cisco.com/go/datavirtualization UU UU [英語] を参照してください。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 15.06 http://www.cisco.com/jp 9/ 9
© Copyright 2025 Paperzz