その他サービス

Kinesis Data Streams とは?リアルタイムストリーミング基盤

Amazon Kinesis Data Streams は リアルタイムストリーミングデータを処理する基盤。プロデューサーがレコードを送信し、複数のコンシューマーが並列に処理する。シャードで水平スケールし、データは 24 時間〜365 日保持される。 ---

リアルタイムストリーミング基盤。秒間数百万レコードを並列処理可能。


1. 概要(端的に)

Amazon Kinesis Data Streams は リアルタイムストリーミングデータを処理する基盤。プロデューサーがレコードを送信し、複数のコンシューマーが並列に処理する。シャードで水平スケールし、データは 24 時間〜365 日保持される。


2. 何ができるか

  • 大規模ストリーミング:秒間数百万レコード
  • 複数コンシューマー:1 ストリームから多数並列処理
  • データ保持:24 時間(標準)〜 365 日
  • シャード単位スケール:1 シャード = 1 MB/s 書込、2 MB/s 読み出し
  • Lambda / KCL / Firehose 連携

3. 特徴

観点特徴
追加料金シャード時間 + データ取り込み量
シャード単位スケール1 MB/s in、2 MB/s out
保持24 時間〜365 日
コンシューマー数Enhanced Fan-Out で 20 並列
Replay保持期間内なら再処理可

Provisioned vs On-Demand

  • Provisioned:シャード数を事前指定
  • On-Demand:自動スケール(2024-)

4. 仕組み

Kinesis は シャードにレコードを格納し、コンシューマーが シーケンス番号順に読み出す

動作

  1. プロデューサーが PutRecord
  2. シャードキーでシャード割当
  3. コンシューマー(Lambda / KCL / Firehose)が読み出し
  4. シーケンス番号で順序保証
  5. 24 時間後 or 設定期間後に削除

5. ユースケース

ユースケース 1:IoT データ処理

センサーデータの集約 → 異常検知。

ユースケース 2:ログストリーミング

アプリログをリアルタイム分析。

ユースケース 3:金融取引

取引データのリアルタイム処理。

ユースケース 4:クリックストリーム

Web サイトの行動データ収集。


6. 関連用語


7. 関連サイト


🎓 試験での出題傾向

試験重要度主な出題パターン
CLFストリーミングの概念
SAAリアルタイム処理設計(頻出
DVAプロデューサー・コンシューマー実装
SOAスケール運用