ホワイト ペーパー データ仮想化による分析力の向上 はじめに ベストセラー『Competing on Analytics: The New Science of Winning(分析力を武器とす る企業 強さを支える新しい戦略の科学)』の中で、著者である Thomas H. Davenport と Jeanne G. Harris は「分析の利用と業績の重要な関係が判明した。業績が良い企業(収益、 株主利益率、収益成長率について業界内で優れた企業)は同業他社と比較して分析を戦略 的に活用する傾向が 50 % 高く、この割合は業績の低い企業の 5 倍にのぼる」と述べてい ます。 企業や政府機関は、分析を使って利益の拡大や運用の合理化、顧客維持の改善、製品品 目の拡大、およびリスクの削減などを図ろうとしています。しかし、従来型のデータ統合アプ ローチでは分析の導入速度が遅く、これらの目的を実現する能力が限られています。 Cisco Data Virtualization Platform は、組織が競争に打ち勝つことができるように、分析の 開発を迅速化する俊敏性に優れたデータ統合アプローチを提供します。 このホワイト ペーパーでは、分析パイプラインの概要、ビッグデータとクラウド コンピューティ ングがもたらしている俊敏性に対する障壁、およびデータ仮想化によってこれらの課題に対 処する方法を説明します。お客様の使用事例では、前向きな考えを持つ企業がどのようにこ れらの高度なデータ統合手法を活用して分析を促進しているのかを説明します。 © 2014 Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 1/ 9 分析パイプライン データは分析に欠かせないものであり、多様であればあるほど、活用できます。ベストセラー となった 『Big Data: A Revolution That Will Transform How We Live, Work, and Think(ビッグ データの正体 情報の産業革命が世界のすべてを変える)』の中で著者の MayerSchonberger と Cukier は、以前は関連性のなかったまったく異なるデータが結合して、隠 れていた洞察が明らかになったときに起こる相乗効果について説明しています。しかしこれ らの高度な分析データ要件は、ソースが多様になるほどデータ統合が複雑になり、進捗が 制約されるため諸刃の剣であると言えます。 上の図は、通常の分析パイプラインの概要を表しています。多くのアナリストは、分析の実 行に必要なデータの収集に半分以上の時間と手間を費やしており、ビッグデータとクラウド コンピューティングの出現により、この状況はさらにやっかいになっています。一般的なアナ リストはデータに関するさまざまな課題に直面しており、それらの課題を解決しなければなり ません。 多様なデータ形式 かつてはほとんどのデータが表形式で、しかもリレーショナルでした。しかし、この 5 年の間 に Web サービスやその他の非リレーショナル データ ストリームからの半構造化データが急 増し、その状況は一変しました。アナリストは、表形式、XML、キーと値のペア、半構造化ロ グ データなど、複数の形式でデータを扱わなければならなくなりました。 複数のインターフェイスとプロトコル データへのアクセスはますます複雑になっています。アナリストはかつて ODBC を使用して データベースにアクセスするか、同僚から電子メールで送られてきたスプレッドシートを受信 するだけでした。現在は、SOAP または REST を使った Web サービス、Hive を使った Hadoop データ、および独自の API を使ったその他の種類の NOSQL データなど、さまざま なプロトコルを通じてデータにアクセスする必要があります。 © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 2/ 9 データ セットの大容量化 データ セットの容量はこの 10 年でますます拡大し、すべてのデータをデスクトップなどの 1 つの場所に集めることは不可能な状況になっています。Hadoop の普及が進んでいるのは、 このプラットフォームに大量のデータを安く簡単に保存できるからです。アナリストは、データ の場所を変えずに、データをインテリジェントにサブセット化し、複数ソースからのデータと結 合して使えるようにする必要があります。 反復手法 分析プロセスは調査と実験で特徴付けられます。これには、調査の進行に合わせてデータ セットを繰り返し集め、更新する必要があります。つまり、データの俊敏性が分析の要と言え ます。 Cisco Data Virtualization データを元のソースから抽出し、一定の特性を持った分析データ ストアに読み込ませる従来 型のデータ統合はコア アプローチとして今でも有効です。しかし、さまざまな最新ソースの データを統合して、より広範囲の分析を実行する必要がある場合はどうでしょうか。 たとえば、マーケティング キャンペーンの効果を分析している場合、分析全体では次のよう な複数の既存データ リポジトリの分析データが必要になります。 Hadoop の Web サイト クリック回数分析 Unica の電子メール キャンペーン メトリック分析 Manticore のナーチャー マーケティング分析 salesforce.com の見込み客および販売機会分析、SAP BW の収益分析 これらの既存の多様なデータ サイロを物理的に統合するために別のサイロを作成する価値 はあるのでしょうか。あるいは、データ仮想化を使ってこれらのサイロを連携させた方がよい のでしょうか。 ビジネスと IT に大きなメリットをもたらすデータ仮想化 Cisco Data Virtualization Platform を使って分析機能を向上させると、さまざまなメリットが あります。 迅速なデータ収集により分析のインパクトを促進:CIS の高速なデータ ディスカバリ およびアクセス ツールによって、新しい分析プロジェクトに必要なデータ セットを迅速 かつ容易に収集できます。 タイムリーなビジネス上の洞察を提供するクエリ最適化:CIS のクエリ最適化のアル ゴリズムと手法は、業界最高レベルの速さを誇り、分析に必要な情報をタイムリーに 提供します。 © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 3/ 9 データの連携により状況を完全に把握:CIS のデータ連携により、メモリ内のデータ を仮想的に統合して、物理的なデータ統合のコストやオーバーヘッドをかけずに状況 を把握できます。 データ ディスカバリによりデータの拡散に対応:CIS 独自のデータ ディスカバリに よってエンティティと関係の識別を自動化し、データ モデリングを迅速化できるため、 アナリストは分散されたデータ資産を的確に理解し、活用できます。 データ抽象化により複雑なデータをシンプル化:CIS の優れたデータ抽象化ツール により複雑なデータを簡素化し、データをネイティブの構造から共通のセマンティクス に変換して使いやすくします。 分析サンドボックスとデータ ハブ オプションで開発の柔軟性を提供:CIS のデータ アクセス、キャッシュおよび配信機能を、サンドボックスを使ったアドホック分析から データ ハブによる定期的な分析まで、多様な分析要件をサポートするよう設定でき ます。 データ ガバナンスで管理を最大化:CIS のデータ ガバナンスによりデータ セキュリ ティ、データ品質および 24 時間 365 日の運用を実現し、ビジネスの俊敏性と必要な 管理のバランスを図ります。 階層型のデータ仮想化アーキテクチャで迅速な変更を実現:CIS の柔軟なデータ仮 想化アーキテクチャと迅速な開発ツールにより、変化し続ける分析ニーズに対応する ために必要な俊敏性が提供されます。 データ仮想化を使用した分析データの統合 分析データ ドメインには次を含むあらゆる種類のデータが含まれます。 Enterprise Data Warehouse などのソースの従来型エンタープライズ データ Hadoop などのソースのビッグデータ SaaS アプリケーションやパブリック プロバイダーのクラウド データ Facebook や Twitter などのサイトのソーシャル メディア データ スプレッドシートやフラット ファイルの個人/デスクトップ データ Cisco Data Virtualization Platform は、これらすべてのソースを統合して、分析とビジネ ス上の知見を改善する最適なソリューションです。このプラットフォームは、データの検出、 アクセス、連携、抽象化、および配信のための完全な開発および実行時環境を提供しま す。アクセスは標準ベースのプロトコルと API を介して実行され、結果のデータは、保存 方法や物理的な保存場所に関係なく、単一の仮想ロケーションから安全に公開されます。 Cisco Data Virtualization Platform でこれらの各データ クラスを統合する方法について、 以下で詳しく説明します。 © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 4/ 9 エンタープライズ データ 優秀なアナリストは、単にウェアハウスのデータだけでなく、すべてのエンタープライ ズ データへのアクセスを必要とします。このデータの多くはリレーショナルであっても、そ れぞれが独自のデータ モデルを使用する、分散された複数のサイロに存在します。接 続、認証プロトコル、SQL ダイアレクトおよびデータ モデルの多様化により、エンタープ ライズ データは以前に比べ活用が難しくなっています。Cisco Data Virtualization Platform は、多くのエンタープライズ データ管理プラットフォームへの組み込みの接続 と、データのクエリを実行するための標準 SQL インターフェイスを提供することで、エン タープライズ データへのアクセスをシンプル化します。また、さまざまなサイロのデータ エンティティ間の関係を検出するためのツールも用意されています。 ビッグデータ Hadoop はビッグデータ分析の最先端リポジトリとして急速に普及しています。しか し、Hadoop データ ソースを操作するために使用される MapReduce パラダイムは標準 的な企業の IT 部門では正しく理解されていません。これは専門的な分析を実行している 場合は問題にならないかもしれませんが、SQL などのエンタープライズ IT 標準言語を 使って Hadoop とエンタープライズ データを結合しようとすると大きな障壁となります。 Cisco Data Virtualization Platform は、Hive を統合および拡張し、エンタープライ ズと Hadoop 両方のデータ ソースでクエリを実行するための統合された SQL ベース アプローチを提供してクエリ言語の問題を解決します。複雑なデータの加工や整理は MapReduce により実行されますが、そのデータを利用した他のデータとの結合はデー タ仮想化により簡単に実行できます。 クラウド データ 多くの企業は Salesforce.com などの SaaS プラットフォームを利用しており、その 結果クラウドに大量のデータが保存されています。このデータは分析において非常に重 要です。また、特定のデータ セットを活用したい企業向けに、サード パーティ プロバイ ダーによるデータ提供も増えています。これらの種類のデータにはどちらもサービス プ ロトコルを通じてインターネット上でアクセスする必要があります。 Cisco Data Virtualization Platform は、ほとんどのクラウドベース データ ソースへ は標準の SOAP や REST プロトコル、他のデータ ソースへのアクセスには他の Web サービス プロトコルなどを利用してアクセスします。また、CIS はこのデータのクエリ、変 換およびキャッシュを容易にして分析に適したものにします。 ソーシャル メディア データ Facebook、Twitter およびその他のソーシャル メディア サイトには顧客分析に役 立つ大量のデータが保存されています。しかし、このデータに標準プロトコル経由でアク セスすることは難しく、また、適切な認証を得るのは困難です。 © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 5/ 9 Cisco Data Virtualization Platform は、Gnip などのサードパーティー データ プロ バイダーを通じてこのソーシャル メディア データにアクセスし、データを統合できます。 ソーシャル メディア サイトによりデータの配布を正式に認められている Gnip と、データ にアクセスして変換を行うことができる CIS を結合することで、ソーシャル メディア デー タをアナリストのデスクトップで利用できます。 個人/デスクトップ データ アナリストが使用するデータの大部分は他の場所から取得されるデータですが、ア ナリストは他のデータと併せてローカルのスプレッドシートやフラット ファイルも使用しま す。アナリストにとってこのようなファイルは、実行中の分析を補う専門的なデータ セット を作成するための、重要なツールの 1 つです。 アナリストは Cisco Data Virtualization Platform を使って Excel やフラット ファイ ルのデータに簡単にアクセスし、データを統合できます。多くの場合、このデータは型指 定されていないか、テキスト データです。また CIS を使ってデータを適切な形式に変換 することができます。 データ仮想化によるデータ ハブと分析サンドボックスの有効化 Cisco Data Virtualization によって、新しい分析の開発または既存の分析を改善できます。 さらに、CIS による分析のサポートは、1 回限りの分析サンドボックスを使用した一度限りの プロジェクトから、分析データ ハブを介した複数の分析アプリケーションの継続的なサポート まで幅広く対応します。 Cisco Data Virtualization を使って、以下を実行できます。 企業内外で利用可能なデータ ソースを検出する 必要なデータ ソースへのアクセスをシンプル化し、同時にセキュリティおよびガバナ ンス ポリシーに準拠する 物理、仮想またはハイブリッド サンドボックスあるいは分析データ ハブで必要なデー タ セットを結合する データを任意の数の分析ツールに配信する これらすべてのアクティビティを迅速かつ容易に実行する 俊敏な分析をサポートするための幅広いデータへのアクセス、変換、統合は、CIS を使えば さらにシンプルになります。さまざまなプロトコルや形式を利用するビッグデータとクラウド データの世界において、データ仮想化はデータのアクセスと使用をシンプル化および迅速化 し、分析およびビジネス上の知見を向上させるための強力なソリューションを提供します。 © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 6/ 9 ある資産管理会社で採用されている分析と データ仮想化 ビジネスの背景 管理している資産が 1,300 億ドルを超えているこのグローバルな資産管理会社は、さまざ まな資産管理、退職プランおよび投資信託サービスを提供する、米国最大手の資産管理会 社の 1 社です。 分析の背景 金融サービスでは、アップセル キャンペーンとクロスセル キャンペーンが会社の成長の 50 % 以上を占めることがあります。したがって、最大限の効果を得るために、Wall Street Journal の広告や CNBC のコマーシャルから月次計算書の折り込み広告まで、あらゆる新 しいマーケティング キャンペーンを活用する必要があります。 この企業のマーケティング キャンペーンは、ビッグデータやクラウド ソースだけでなく、従来型 のエンタープライズ ソースも含め、複数のセールスおよびマーケティング情報サイロに広がっ ていました。この多様性により、データの統合は遅くなり、困難になっていました。キャンペーン 結果は最新のものとはいえず、完璧でもありませんでした。アップセルおよびクロスセルの販 売機会を逃していたため、マーケティング キャンペーンのコストは無駄になっていました。 データ統合の問題 キャンペーンの管理分析用に SAS 分析ツールが選択されていました。 分析要件は過去のキャンペーンのレトロスペクティブ分析から、 現在進行中のキャンペーンのリアルタイム分析、そして将来の予測分析まで 多岐にわたっていました。 これらの分析には次のような複数のソースのデータが必要でした。 Web 分析(ビッグデータ) DST HiPortfolio Trades and Asset Management(クラウド) Salesforce.com Customer Master(クラウド) Salesforce.com Sales Force Automation(クラウド) Oracle Siebel CRM(Oracle) Investment Account Master(Oracle) IBM Unica Campaign Management System(SQL Server) StrongMail Email Marketing(SQL Server) © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 7/ 9 データ統合代替案の検討 同社では、このデータを統合されたデータ ウェアハウスにまとめることを検討しました。しか し、追加のレプリケーション処理とストレージ コストが高すぎました。また、新しいキャンペー ンを設定するためのリード タイムが長すぎました。さらに、そのアプローチはリアルタイムの キャンペーン分析をサポートしていませんでした。 Cisco Data Virtualization ソリューション 代わりに、Cisco Data Virtualization Platform を多様なマーケティング データ ソースの分 析データ ハブとして実装して、SAS で履歴、リアルタイムおよび予測マーケティング キャン ペーン分析を実行できるようにしました。 新しい各キャンペーンに先立ち、すべてのソースのセールスおよびマーケティング アクティビ ティ データは特定のキャンペーンの関連付けとともに CIS でモデル化されます。 次に、キャンペーン前、キャンペーン中、またはキャンペーン後の任意の時点で、マーケティ ング アナリストとセールス チームがマーケティング データ ハブで SAS 分析を実行します。 成果 この会社は、次のようなさまざまな成果をあげました。 すべてのセールスおよびマーケティング データ ソースを初めて統合することで、マーケティ ング キャンペーンの実際のインパクトを把握できるようになった。 リアルタイム データによって、キャンペーン中の販売代理店の対応が向上し、結果と して収益が向上した。 幅広い分析によってさまざまなマーケティング ミックスの効果が明らかとなり、影響力 の高い、コスト効率に優れた将来のキャンペーンへとつながった。 統合の設定が容易になり、新しいキャンペーンを迅速に開始し、市場の反応もすば やく得られるようになった。 複製や保持の必要なデータ量が減り、IT コストが大幅に削減された。 © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 8/ 9 まとめ 分析のビジネス価値はかつてないほど増大しています。しかし、企業はすでに、顧客、見込 み顧客、ビジネス プロセス、サプライヤ、パートナー、競合などに関する大量のデータを抱え ています。さらに、このデータはアナリストのデスクトップ、ビッグデータ ストア、データ ウェア ハウスや店舗、トランザクション システム、クラウドに分散されています。 データ仮想化によって、これらの複雑な課題を解決し、従来型のデータ統合手法よりも大幅 に少ないリソースで重要な分析データ ニーズに迅速に対応することができます。 このホワイトペーパーでは、データ統合に対する Cisco Data Virtualization アプローチに加 え、ビッグデータ、クラウド データ、ソーシャル メディア データおよびローカル データの統合 について詳しく説明しました。データ仮想化を導入し、分析に役立てるための具体的な方法 を理解できたことと思います。 大手資産管理会社のキャンペーン分析の使用例では、新たな知識を補強するための分かり やすい例をご紹介しました。 同様の分析機会やデータ統合の課題に直面している場合は、Cisco Data Virtualization の 導入をご検討ください。ビッグデータによるメリットとは、すべてのデータを十分に活用できる ことです。 http://www.cisco.com/jp © YEAR Cisco and/or its affiliates. All rights reserved. This document is Cisco Public. 15.06 9/ 9
© Copyright 2024 Paperzz