従来のデータストレージと分析ツールでは、価値のあるビジネス上のインサイトを獲得するのに必要な俊敏性と柔軟性を得られません。これが、多くの組織がデータレイクのアーキテクチャに移行を進めている理由です。データレイクをすばやく簡単に構築できるように、AWS およびコンピテンシーパートナーはデータレイクのクイックスタートおよびすぐに利用開始できるソリューションを提供しています。データレイクは、大量のデータを集中的に保存する場所を用意し、企業内の複数のグループによる分類、処理、分析、利用を簡単に行えるようにする、アーキテクチャ上のアプローチです。データはそのままの状態で保存でき、事前定義のスキーマに変換する必要はありません。また、データに対してどのような分析を行うかを事前に把握しておく必要もありません。
AWS および APN コンピテンシーパートナーが、異種の大量のデータを AWS のデータレイクに移行する企業や組織をどのように支援してきたかをご覧ください。移行によって、企業や組織は迅速かつ簡単にデータを活用し、ビジネス上の重要なインサイトを取得できるようになりました。
- データの形式や規模を問わず、低コストで収集し保存する
- データを保護し、不正アクセスを防ぐ
- 中央リポジトリでデータを管理し、カタログ作成、検索、有用なデータの特定を行う
- 新しいタイプのデータ分析をすばやく簡単に実行する
- アドホック分析、リアルタイムストリーミング、予測分析、人工知能 (AI)、機械学習を扱う幅広い分析エンジンを利用する
データレイクは、既存のデータウェアハウスを補完して拡張するために使用することもできます。データウェアハウスを既にお使いの場合、またはこれから導入を検討している場合、構造化および非構造化データのソースとしてデータレイクを使用することができます。
AWS 上のデータレイクでは、ビッグデータ向けの最も包括的なプラットフォームを利用できます。AWS では、収集、保存、分類、分析したデータから価値あるインサイトを獲得するのに最適で安全なインフラストラクチャと、スケーラブルでコスト効率の高いサービスを幅広く提供しています。AWS を使用すると、独自のデータレイクを容易に構築し、データ分析の要件に合わせてカスタマイズできます。公開されているクイックスタートを参照してご自身で使用を開始することも、APN パートナーのスキルと専門知識を活用してお客様に合わせた実装を行うこともできます。データレイクは、構造化および非構造化データのソースとして使用できます。
Amazon Kinesis、AWS Import/Export Snowball、AWS Direct Connect など、さまざまな方法でデータを容易に取り込むことができます。Amazon Simple Storage Service (Amazon S3) を使用すると、規模や形式に関わらず、あらゆるデータを保存できます。
AWS では、複数の施設、ネットワーク、ソフトウェア、およびビジネスプロセスにわたる、最も厳しい要件を満たす機能が提供されます。ISO 27001、FedRAMP、DoD SRG、および PCI DSS などの認証に対応するために、環境は継続して監査されます。
実質的にどのようなビッグデータアプリケーションでも構築でき、データの容量、生成速度、および種類に関わらず、あらゆるワークロードがサポートされます。AWS には毎年 50 を超えるサービスと数百の機能が追加されており、クラウドでのビッグデータの収集、保存、処理、分析、および可視化に必要なすべてのものが提供されます。
人気スポーツのアパレルウェブサイトを運営する、ファングッズの小売業者 Fanatics は、取引システム、e コマースシステム、バックオフィスシステムといった複数の履歴ソースおよびストリーミングソースから、Amazon S3 のデータレイクに数テラバイトものデータを取り込む必要がありました。取り込んだ後のデータは、Fanatics が 300 以上のオンラインストアおよびオフラインストアで提供する製品に関連する顧客ニーズをより正確に特定、予測、実現するために分析します。
そのために、Fanatics では Attunity Replicate を使用しています。このソフトウェアソリューションには、継続的なデータキャプチャ (CDC) 機能と並列的スレッディング機能があり、複数のソースから Amazon S3 のデータレイクにリアルタイムでデータをストリーミングできます。その後、データを Apache Kafka に取り込んでリアルタイム分析を行うことができます。Attunity によって、Fanatics は、異なるソースからデータを手作業で抽出するという手間のかかる作業から解放され、リアルタイムで結果を確認できるようになっています。
オンラインセミナータイトル: Fanatics Ingests Streaming Data to a Data Lake on AWS
お客様のプレゼンター: Alan Chang 氏、シニアプロダクトマネジャー、Fanatics
Attunity のプレゼンター: Jordan Martz 氏、テクノロジーディレクター
AWS のプレゼンター: Paul Sears 氏、ソリューションアーキテクト
データレイク、データウェアハウス、ストリーミングなど、ソースの異なるデータに対してデータサイエンスのワークロードを実行することは、データを利用して業務および製品の改善を進めたい組織にとって課題となります。教科書を出版する McGraw-Hill では、デジタルラーニングへの注目の高まりに合わせて、データのサイロ化を解消してビジネスモデルを改革することが必要でした。特に求めていたのは、複雑な分析操作を迅速に行う機能と、ビジネスアナリスト、データエンジニア、データサイエンティストとの間のコラボレーション機能でした。
McGraw-Hill では、統一された分析プラットフォームとして Databricks をデプロイすることで、ストリーミングデータや、Amazon S3 のデータレイクおよび複数のデータウェアハウスに保存していた過去のデータを扱う作業の効率が高まりました。このオンラインセミナーでは、Apache Spark™ の開発元が開発した Databricks により、従来のソリューションで提供できなかった規模と速さでのストリーミングおよび過去データの分析を、McGraw-Hill がどのように実現したかをご覧いただけます。数週間かかっていた従来のデータサイエンスのワークロードの実行が、現在では数時間に短縮されました。
オンラインセミナータイトル: McGraw-Hill Optimizes Analytics Workloads with Databricks
お客様のプレゼンター: Matthew Ashbourne 氏、リードソフトウェアエンジニア、McGraw-Hill Education
Databricks のプレゼンター: Brian Dirking 氏、パートナーマーケティング担当シニアディレクター
AWS のプレゼンター: Pratap Ramamurthy 氏、パートナーソリューションアーキテクト
ビッグデータ技術は、複雑であると同時に、時間のかかる手作業によるプロセスを必要とします。ビッグデータの運用をインテリジェントに自動化できる組織では、コストの削減、チームの生産性向上、スケールの効率化、サービス停止のリスク回避を行うことができます。
このオンラインセミナーでは、テレビコンテンツのデジタル録画プラットフォームを構築した TiVo の代表者が、需要の変化に応じて動的にスケールできる新たなビッグデータおよび分析プラットフォームをどのように実装したかを紹介します。TiVo のソリューションでは、ビッグデータのクラスターの調整を容易にするため、Amazon Elastic Cloud Compute (Amazon EC2) および Amazon EC2 スポットインスタンスを使用して、Amazon Simple Storage Service (Amazon S3) に置いたデータレイクからデータを読み込みます。これにより、開発コストを抑え、ネットワークおよび広告主のユーザーをサポートするのに必要な労力を低減させることができました。TiVo は、数百万世帯から集められた視聴に関するテラバイト規模のストリーミングデータおよびバッチデータを、低コストですばやく取り込み、処理し、分析にまわすうえで得られた教訓やベストプラクティスを共有します。
オンラインセミナータイトル: TiVo: How to scale new products with a data lake on AWS and Qubole
お客様のプレゼンター: Ashish Mrig 氏、ビッグデータ分析担当シニアマネジャー、TiVo
Qubole のプレゼンター: Harsh Jetly 氏、ソリューションアーキテクト
AWS のプレゼンター: Paul Sears 氏、ソリューションアーキテクト
AWS を使用して開発期間を短縮し、革新を推進した方法をご覧ください。このオンラインセミナーでは、フィットネス、減量、筋力増強のホームエクササイズビデオの販売を行う Beachbody による、Talend を使用した AWS のデータレイクアーキテクチャへの移行についての体験談が紹介されます。Beachbody でオープンなエンタープライズデータプラットフォームを構築し、従業員にセキュアで管理の行き届いたデータへのアクセスを提供し、企業全体の DevOps 効率を改善した方法が紹介されます。
このオンラインセミナーを受講すると、Beachbody で保有するさまざまな構造化および非構造化データソースのデータレイクへの移行、開発期間とテストサイクルの短縮、リアルタイムのデータ処理に共通するデプロイメント上の複雑な課題の解決を Talend および AWS がどのように支援したかをご覧いただけます。
オンラインセミナータイトル: Architecting an Open Data Lake for the Enterprise
Talend のプレゼンター: Ashwin Viswanath 氏、クラウド製品マーケティング担当ディレクター
お客様のプレゼンター: Eric Anderson 氏、データ部門エグゼクティブディレクター、Beachbody
AWS のプレゼンター: Pratap Ramamurthy 氏、ソリューションアーキテクト
Informatica の Intelligent Data Lake Management ソリューションでは、大量の生のデータを AWS の信頼できるデータレイクに取り込んで、データのクレンジング、処理、管理、セキュリティ確保を行うことができます。Informatica のメタデータ駆動の AI と企業カタログの作成機能を使用すると、アナリストなどのビジネス上のステークホルダーは、新鮮で的確なビジネス上のインサイトを得るためのデータをすばやく見つけてプロファイリングし、整え、守ることができます。端的に言うと、Informatica は AWS のデータレイクの力とビッグデータから得たインサイトを活用し、イノベーションと売り上げの促進につなげます。
ビッグデータとそこから生成されるメトリクスに依存する現在のビジネスから本当の利益を得るためには、定義を集約し、どこからでもアクセスできるようにする必要があります。本日取り上げるソリューションは、Looker です。社内の全従業員に、意思決定に必要なデータの検索や探索の機会を提供する、先進的なデータプラットフォームです。Looker はアマゾン ウェブ サービス (AWS) のようなクラウドプラットフォーム向けに構築され、データレイクなどの最新のクラウドデータベースに対して直接クエリを実行することができます。お客様は Looker を使用して、社内向けの分析を行ったり、顧客、パートナー、ベンダーにデータの提示を行ったりすることができます。
47Lining を使用した AWS でのデータレイクの継続的な管理により、データレイクの利点を引き出します。
Cloudwick の実績ある 3 段階のプロセスにより、AWS でのデータレイクのアーキテクチャの設計および管理も安心です。
NorthBay は、AWS との経験と密接な協力により、お客様に合わせてカスタマイズされたデータレイクソリューションを構築します。