
t0mmy
2020年12月30日に参加
学習履歴詳細
Amazon Timestream 概要をつかむ
やったこと
以下の勉強会に参加
学んだこと
Amazon Timestreamとは
時系列データの扱いに特化した、サーバーレスのデータベース。
スケーリングも含めて完全マネージドサービス。
コスト最適
Amazon Timestreamは、以下二つのストレージで構成される。
- 高価だが高速なストレージ
- 安価だが低速なストレージ
S3のようにライフサイクルポリシーを設定可能。
これらを組み合わせて、コストの最適化を図ることができる。
ユースケース
収集したデータを、一時間だけ高価で高速なストレージへ。一時間経過した場合、安価で低速なストレージへ。
-> 収集後一時間は、高速なクエリが可能。それ以降は安価なストレージへ移行して、コスト最適を図る。
時系列専用のデータモデル
以下の処理を柔軟に実施可能なデータモデルを構築している。
- タイムスタンプをキーとした高速なデータ取得
- 属性情報の付与
時系列処理用関数
以下をはじめとした、時系列処理用の関数を提供。利用者側で実装する必要がない。
- 平滑化関数 ... ノイズデータを除去しつつ、データを均一化
- 補完関数 ... 欠落データを推測し、補完する
構成要素
Table
時系列データの集合を保持する要素。
RDBのテーブルに相当。
Record
一つ分のデータ。
RDSの行、またはレコードに相当。
Recordは、Dimension(メタデータ群)とMeasure(データ群)で構成される。
Dimensionはクエリ時のキーとして使用できる。
Time - Series
テーブルから、特定の属性値で絞込をかけたレコード群。
- location : tokyo , sensor_id : hogeのレコード群 など
AWS
2022年03月28日(月)
0.5時間