AWS DataSync は、オンプレミスストレージと Amazon S3 または Amazon Elastic File System (Amazon EFS) との間のデータの移動を自動化するデータ転送サービスです。DataSync は、独自のインスタンスの実行、暗号化の処理、スクリプトの管理、ネットワークの最適化、データ整合性の検証など、移行を遅らせたり、IT 運用に負担をかけたりするデータ転送に関連する多くのタスクを自動的に処理します。DataSync を使用すると、オープンソースツールよりも最大 10 倍高速でデータを転送できます。DataSync はオンプレミスのソフトウェアエージェントを使用して、既存のストレージまたはネットワークファイルシステム (NFS) プロトコルを使用するファイルシステムに接続するため、スクリプトを書いたり、AWS API で動作するようにアプリケーションを変更する必要がありません。DataSync を使用すると、AWS Direct Connect または AWS へのインターネットリンクを介してデータをコピーすることができます。このサービスにより、1 回限りのデータ移行、定期的なデータ処理ワークフロー、データの保護と復旧のための自動レプリケーションが可能になります。DataSync を使い始めるのは簡単です。DataSync のエージェントをオンプレミスにデプロイし、ファイルシステムまたはストレージアレイに接続し、AWS ストレージとして Amazon EFS または S3 を選択して、データの移動を開始します。コピーしたデータに対してのみ料金が発生します。
利点
転送の簡素化と自動化
AWS DataSync を使用すると、オンプレミスストレージと AWS 間のネットワークでのデータ転送が簡単になります。DataSync は、データ転送プロセスと、高性能で安全なデータ転送に必要なインフラストラクチャの両方の管理を自動化します。また、このサービスには自動暗号化とデータも含まれています。これらすべてにより、高速で信頼性が高く安全な転送に必要な社内の開発と管理が最小限に抑えられます。
データを 10 倍速く移動
ネットワーク経由で AWS へ素早くデータを転送し、オープンソースのツールの場合と比べて最大 10 倍の速さでデータを転送します。DataSync は、専用のネットワークプロトコルとパラレル、マルチスレッドアーキテクチャを使用して、転送を高速化します。これにより移行、分析や機械学習のためのデータ処理ワークフローの繰り返し、データ保護プロセスがスピードアップされます。
運用コストの削減
DataSync の一定で、ギガバイト単位の価格設定を活用すると、データを費用効果の高い方法で移行することができます。また、スクリプトの開発と管理のコストを節約でき、費用がかかる商用の転送ツールが不要になります。
仕組み
ユースケース
データ移行
データセンターを閉鎖するか、ストレージアレイを廃止する場合、DataSync を使用して、アクティブなデータセットをネットワーク経由で Amazon S3 または Amazon EFS に速やかに移行することができます。DataSync は、完全な初期コピーと変化するデータの増分転送の両方を行います。また、暗号化と整合性のチェックが含まれているため、データは安全、無傷で、すぐに使用できる状態で転送されます。DataSync を使用して、Snowball Edge と並行してアクティブで変化するデータをコピーし、静的データを Amazon S3 に移行することができます。
ハイブリッドワークロードのためのデータ処理
処理のために AWS の内外に移動する必要があるデータをオンプレミスシステムで生成または使用している場合、DataSync を使用して転送を高速化およびスケジュールすることができます。メディアやエンターテイメントのビデオ制作、石油およびガスの地震探査、ライフサイエンスの機械学習、金融のビッグデータ分析など、アクティブなファイルを AWS に迅速に移行する必要がある業界で、重要なハイブリッドクラウドワークフローのスピードアップに役立ちます。
データ保護
大規模なネットワークアタッチトストレージ (NAS) システムを使用している場合は、レプリケーションまたはセカンドハードウェアスタックへのバックアップのいずれかによって保護するファイルがたくさんある可能性があります。DataSync では、S3 ライフサイクル管理ポリシーで Amazon Glacier にアーカイブできるオンラインコピー用にファイルを Amazon S3 にレプリケートすることができます。または、スタンバイファイルシステム用に Amazon EFS にデータを送信することもできます。
「Celgene では、研究チームが癌やその他の深刻な状態に対する治療の発見と開発に熱心に取り組んでいます。AWSは、イノベーションプロセスの不可欠な部分であり、当社の IT チームにとって、可能な限り多くの AWS のサービスを使用することは、新薬発見の支援の妨げとなるインフラストラクチャやツールの運用およびコストという負担を排除してくれることを意味します。当社のラボでは、ペタバイト単位のデータ (置き換え不可能な知的財産) が生成され、AWS DataSync を使用してAmazon S3 や Amazon EFS にデータを簡単、迅速、コスト効率よく転送しています。AWS にデータがなければ、速やかな革新を実現する方法はありません。AWS DataSync は既存のストレージシステムと連携し、可能な限り多くの帯域幅を効率的に使用して、データを安全に AWS に取り込みます。」
Lance Smith 氏、研究コンピューティング担当ディレクター - Celgene