セキュリティ、分析!AWS Whitepaper(Overview of Amazon Web Services)の記載内容
2021/10/21
AWS認定ソリューションアーキテクトアソシエイトの再認定のために勉強しております。合格体験記を調べてみると、AWSのホワイトペーパーを読むと良いと書いてありますね。私の約3年前の勉強時に1度目受験で不合格、ホワイトペーパーを読んで臨んで2度目で合格でした。
ということで、今回もホワイトペーパーを読んでから試験に臨もうと思います。
セキュリティとコンプライアンス
- 引用します。While AWS manages security of the cloud, you are responsible for security in the cloud. これは日本語に訳さないほうがしっくりくる表現ですね。AWSはクラウド自体のセキュリティは管理するが、クラウドの中のセキュリティはユーザの責任です。
Analysis(分析)
分析に関わるサービスの記載が多くあります。無理せずできるだけ沢山記載していきます。
Amazon Athena
- サーバレスでS3の中のデータを標準SQLで分析できる。
Amazon CloudSearch
- マネージド型のWebサイトのための検索サービス。
Amazon EMR
- ビッグデータのプラットフォーム。
Amazon FinSpace
- 金融業界向けのデータ管理・分析のためのサービス。
- 金融機関では、莫大なデータ(証券の価格やポートフォリオ)を取り込んで、分析する必要があるが、そういったことを助けるサービス。
- ボリンジャーバンド等、100以上の機能を備えている。
Amazon Kinesis
- これは聞き覚えがあるのでソリューションアーキテクトアソシエイトの試験で出たかも知れない。今回も出るかも知れない(あくまで予想)。
- リアルタイムデータを分析して、素早く対応できるサービス。
- リアルタイムとは、例えば、ビデオ、音、アプリのログ、Webサイトのクリック数等、IoTで収集したログ(利用状況ログ、センサーログ)、等。
- 現在次の4つのサービスがある。Kinesis Date Firehose、Kinesis Data Analytics、Kinesis Data Streams、Kinesis Video Streams。
Amazon Kinesis Data Firehose
- ストリーミングデータを読み込み、Amazon S3やAmazon Redshift、Amazon OpenSearch Service、Splunk等に書き込むサービス。
- Amazon S3にデータ保管することで、(AWSサービスでない)既存のビジネス分析ツール等が使えるようになる。
Amazon Kinesis Data Analytics
- ストリーミングデータを取り込んで分析できる。
- SQLユーザは簡単にそのデータをクエリしたりできる。
Amazon Kinesis Data Streams
- スケーラブルなデータストリーミングサービス。
- 継続的に1秒当たり数ギガバイトものデータをキャプチャできる。
- Webサイトのクリック数やDBイベント、ソーシャルメディア等、色々なソースからキャプチャできる。
Amazon Kinesis Video Streams
- 接続されたデバイスからビデオを安全にAWSへストリーミングする。
- ストリーミングしたビデオをライブ再生したり、オンデマンドで再生できる。
Amazon OpenSearch Service
- データをリアルタイムに分析して可視化するために、OpenSearchを構築・スケーリング等できる。
- 簡単に使えるAPIやリアルタイムな分析が可能になる。
- Amazon Elastisearch Serviceの後継である。
Amazon Redshift
- 最も広く使われているデータウェアハウスのサービスである。
- 速く簡潔にコスパ良く、SQLやBI(Business Intelligence)ツールでデータの分析ができる。
- テラバイトからペタバイトに及ぶデータに対して分析クエリを実行させられる。
Amazon QuickSight
- 速いクラウド版BI(Business Intelligence)サービス。
- ソフトウェアのインストールすることなく、多くのユーザに対してスケーリングできる。
AWS Data Exchange
- サードパーティーのクラウドからデータをサブスクライブできる。
- サードパーティーには、ロイターやフォースクエア等が含まれる。
- サブスクライブしたデータは、AWS Data Exchange APIを使って読み込み、S3に保存でき、そこからAWSの分析サービスや機械学習サービスと連携できる。
- ユースケースの一つとして、レストランが人口と地理のデータを取り込み、最適な出店場所を選ぶ、ということができる。
AWS Data Pipeline
- AWSのコンピューティングサービスとストレージの間でデータを移動させることができる。
- 定期的にデータにアクセスして、加工したり、結果をS3等に送ることができる。
- データを(S3等に)移行した上で処理等ができるため、コンピューティング側のリソースを気にする必要が減ったり、データ破損による繰り返し実行等もできる。
AWS Glue
- ETL(extract, transform, load)サービスである。
- ETLの各文字は抽出、変換、抽出を示し、データ統合時に必要となるプロセスの頭文字である。
- ETL処理により、データベース等からデータを抽出し、扱いやすいフォーマットに変換して、データウェアハウスに書き出す。これにより、BIツールで分析する際に扱いやすいフォーマット(形式等)になる。
AWS Lake Formation
- データレイクを簡単にセットアップできるサービス。
- データレイクとは、オリジナルデータや加工済みデータ問わない全てのデータが保存されるレポジトリである。
- 一般的に、データレイクのセットアップと管理は、多くのマニュアルを要するし、多くの時間も費やす必要がある。データの書き込み、監視、パーティショニング、等々。しかし、AWS Lake Formationを使うことにより、データの保管場所とセキュリティの設定をする程度で済む。
AWS Managed Streaming for Apache Kafka (Amazon MSK)
- Apache Kafkaでストリーミングデータを処理するアプリケーションを構築・実行するサービス。
- Apache Kafkaとはオープンソースの分散メッセージキューであり、大量のデータを受け渡す役割を担う。
- Apache Kafkaの設定やスケーリング、本番環境による管理は非常にむずかしいものがあるが、このAmazon MSKを使えば、数回のクリックで設定が完了し、クラスターを構成できる。
疑問点等
- Amazon OpenSearch Serviceの具体的なユースケースが知りたい。