t0mmy

2020年12月30日に参加

学習履歴詳細

Amazon Timestream 概要をつかむ

やったこと

以下の勉強会に参加

学んだこと

Amazon Timestreamとは

時系列データの扱いに特化した、サーバーレスのデータベース。
スケーリングも含めて完全マネージドサービス。

コスト最適

Amazon Timestreamは、以下二つのストレージで構成される。

  • 高価だが高速なストレージ
  • 安価だが低速なストレージ

S3のようにライフサイクルポリシーを設定可能。
これらを組み合わせて、コストの最適化を図ることができる。

ユースケース
収集したデータを、一時間だけ高価で高速なストレージへ。一時間経過した場合、安価で低速なストレージへ。
-> 収集後一時間は、高速なクエリが可能。それ以降は安価なストレージへ移行して、コスト最適を図る。

時系列専用のデータモデル

以下の処理を柔軟に実施可能なデータモデルを構築している。

  • タイムスタンプをキーとした高速なデータ取得
  • 属性情報の付与

時系列処理用関数

以下をはじめとした、時系列処理用の関数を提供。利用者側で実装する必要がない。

  • 平滑化関数 ... ノイズデータを除去しつつ、データを均一化
  • 補完関数 ... 欠落データを推測し、補完する

構成要素

Table

時系列データの集合を保持する要素。
RDBのテーブルに相当。

Record

一つ分のデータ。
RDSの行、またはレコードに相当。
Recordは、Dimension(メタデータ群)とMeasure(データ群)で構成される。
Dimensionはクエリ時のキーとして使用できる。

Time - Series

テーブルから、特定の属性値で絞込をかけたレコード群。

  • location : tokyo , sensor_id : hogeのレコード群 など
AWS

2022年03月28日(月)

0.5時間