logo
kmnky blog

AWS 春のObservability祭りに参加してきた

はじめに

春の Observability 祭り 2024 ~Observability 獲得までの旅~というイベントに参加してきました。

スライドは後日公開されるので学んだ内容などをメモとして記載したものです。あまり参考にならないと思います。。

Observability ジャーニーの全体像

最初の発表です。

下記のようなオブザーバビリティに関するページをわかりやすく説明されていました。存在を知らなかったので後日見てみようと思いました。

前半は成熟度モデルについて解説していました。

AWS成熟度モデルの各ステージ

後半は着手するポイントや継続的な改善について説明されていました。

質問を受けて AI はサポートツールのように付き合うのが良いと回答されていましたが、そうするとステージ 4 なんかは理想郷すぎるってことなのかなと思いました。

Observability ジャーニーを実現するための AWS サービス:CloudWatch 編

  • ステージ 1
    • CloudWatch エージェントで 3 本柱全部取れるようになった
    • Synthetics や RUM による顧客に近い部分での監視
  • ステージ 2
    • X-Ray で外形監視も一元的に見れるし、ログやメトリクスと紐づけられる
  • ステージ 3
    • CloudWatch AnomalyDetection で異常検知を取得できる
    • 自動パターン分析(知らなかった。。)
    • DevOps Gru : アプリケーションのメトリクスやイベントを分析し運用パターンを提案してくれる
  • ステージ 4

1 つ目の発表で浮かんだ疑問の通りステージ 4 は理想はあっているようでした。 それに対して、その理想郷が実現できるようにデータを貯めておくという説明をされていたのに納得しました。

Observability はじめの一歩 CloudWatch Synthetics

こちらはちょうど触ったばかりなので一旦割愛します。。発表されていた方が見ていたらすみません。。

Synthetics の料金の説明を聞くと安いように見えますが、他のプロダクトと比べると高いので注意が必要です。

リージョンが同じだとデータセンター内の通信になるのでユーザ体験を再現できないかという、少し意地悪ですが確かにと思う質問でした。その場合は閾値を調整するか AWS ではないサービスを使うのが良いんですかね。。。

サードパーティの差別化は API GW などと連携できるところだそうです。確かに VPC 内に Lambda を作成したりとできますね。

Observability ジャーニーを実現するための AWS サービス:OSS 編

えーどっとと読むですね。初めて知りました。

成熟度モデルにの各ステージで OSS を使った AWS のサービスの紹介でした。 最初は ADOT を中心にテレメトリデータを OSS で取得する方法の解説で、徐々に AMG を用いた相関関係の説明でした。

メトリクスとトレースの相関を知ってはいるものの、ちゃんと見たことがなかったので参考になりました。

あとで質問してみるか、:Rsut の場合は ADOT を使う,OSS を使うって選択肢はどのような時に考えれば良いか?

AWS Observability ベストプラクティス 大紹介

何が重要かを理解し成功の指標(KPI)を定義する

こちらは SLO としていないのは売り上げなどビジネス面でも考えることが必要と解釈しました。自分ができていないところなので勉強になりました。

全てのティアからテレメトリを収集する

外部コンポーネントにデータポイントを持つと説明されていました。確かに今外部連携している部分のメトリクスを取れていないのでやろうと思いました。

Day One から取り入れる

これはどういう意味だろうと思っていましたが、開発の最初で導入するということでした。開発の後半で Observability を考えるのはアンチパータンというのは確かにと思うものの、実践できてなかった。。

抽象的で時間が少ない中の難しいセッションだった。 ただ、いろいろなカットでベストプラクティスを説明されているのであとでゆっくりサイトをみよう。

AWS Observability 関連最新アップデート

こちらは最新のアップデートや事例の紹介でした。

自然言語によるクエリ作成は便利です。 自動パターン分析は最近の機能なんですね。検証してみたいいい機能ですね。 自分が CloudWatch インサイトに苦手意識を持っていてあまり触っていませんでしたが、新機能を元にちゃんと分析できるようにするべきという課題が見つかってよかったです。

低頻度アクセス(Infrequent Access)について初めて知りましたが、こちらの記事を読むと採用が難しそうだなあと私も思いました。。

全体を通しての所感

私の業務でも最近監視周りを見直していて何かヒントを得られるかなと思って参加してみました。 AWS のオブザーバビリティプラクティスを知らなかった私にとっては、その概要を把握できる良い機会だったので目的の達成はまずまずです。 最近ぶち当たっているのは OpenSearch などの OSS との使い分けをどうするか悩んでいるので次はその辺りを聞いてみたいと思いました。 セッションのチョイスや順番はよく考えられていてすごく聞きやすかったです。 ステージ 4 のサービスが安く提供される未来が来るといいですね。

最後まで読んでいただきありがとうございました。