Amazon Athena はインタラクティブなクエリサービスで、Amazon S3 内のデータを標準 SQL を使用して簡単に分析できます。Athena はサーバーレスなので、インフラストラクチャの管理は不要です。実行したクエリに対してのみ料金が発生します。
Athena は簡単に使えます。操作は簡単で、Amazon S3 にあるデータを指定し、スキーマを定義し、標準的な SQL を使用してクエリの実行を開始するだけです。多くの場合、数秒で結果が出てきます。Athena を使用すると、分析用データを準備するための複雑な ETL ジョブは不要になります。これによって、誰でも SQL のスキルを使って、大型データセットをすばやく、簡単に分析できるようになります。
Athena は初期状態で AWS Glue データカタログと統合されており、さまざまなサービスでメタデータの統合リポジトリを作成できます。データソースのクロールとスキーマの検出、新規および修正したテーブル定義とパーティション定義のカタログへの入力、スキーマのバージョニング保持が可能です。また、Glue のフルマネージド型 ETL 機能を使用すると、データ変換や列指向の形式への変更を実行でき、コストを最適化してパフォーマンスを向上できます。
利点
すぐにクエリを開始できる
サーバーレス。ETL 不要
Athena はサーバーレスです。すぐにデータのクエリを実行できるため、サーバーやデータウェアハウスの設定や管理は不要です。Amazon S3 にあるデータを指定して、スキーマを定義し、組み込まれているクエリエディタを使ってクエリを開始できます。Amazon Athena を使用すると、S3 にあるユーザーのすべてのデータを利用できるため、データの抽出、変換、ロード (ETL) といった複雑なプロセスは必要ありません。
クエリごとの料金
スキャンしたデータに対してのみ支払い
Amazon Athena では、実行したクエリに対してのみ料金が発生します。クエリごとにスキャンされたデータの分量に基づいて料金が請求され、1 テラバイトごとに 5 USD が請求されます。データの圧縮、分割、列形式への変換を行うことにより、クエリに対するコストを 30%~90% 削減し、パフォーマンスを向上させることができます。Athena では、Amazon S3 にあるデータのクエリが直接実行されます。S3 以外でストレージに対する追加料金は発生しません。
オープン、高機能、スタンダード
Presto で構築され、標準的な SQL が実行可能
Amazon Athena には ANSI SQL に準拠した Presto が使われており、CSV、JSON、ORC、Avro、Parquet などのさまざまな標準データフォーマットに対応します。Athena は迅速で、アドホックなクエリ問い合わせ方法として理想的です。とはいえ、大きな結合、ウィンドウ関数、配列などの複雑な分析も対応できます。Amazon Athena は可用性が高く、多くの施設や各施設にある多くのデバイスから、コンピューティングリソースを使ってクエリを実行できます。Amazon Athena は、基盤となるデータストアとして Amazon S3 を使用しており、データの可用性や耐久性を向上させます。
高速。非常に高速
大きなデータセットに対してもインタラクティブなパフォーマンス
Amazon Athena を使えば、高速で、インタラクティブなクエリパフォーマンスが得るために十分なコンピューティングリソースがあるかどうかを心配する必要はありません。Amazon Athena では、クエリが自動的に並列で実行されます。そのため、たいていは数秒で結果が出ます。
導入事例
Movable Ink は Amazon Athena を使用して 7 年分の履歴データをクエリし、即座に結果を取得しています。また、データを柔軟に調べて、さらに深い理解を得ることができています。
Atlassian では Amazon Athena や他の AWS の分析サービスを使用してセルフサービスのデータレイクを構築しています。
AWS の開始方法
Amazon Athena の詳細