「SentryJapan ミートアップ」に参加してきました

Sentryの導入から始めた「BOTCHAN」のサービス信頼性向上の取り組み

  • 鈴木 和男さん(wevnal)

Sentryの導入

  • サービスの障害が損失に直結するサービス
  • 昔は信頼性が低い状態だった
    • エラーの検知はユーザからの問い合わせ
  • モニタリングの強化としてSentryを導入した
    • インフラよりもアプリでの障害が多いので先にアプリからやった
    • 費用面でも他より良かった
      • ユーザ単位じゃない
      • プランあげなくてもSSO使える
  • Sentry入れて
    • slackでログが見れる
      • 初出のエラー
      • 高頻度のエラー
    • エラーの重み付けできる
      • slack通知だけのエラー
      • 架電するエラー

Improve Application Performance with Sentry Performance Monitoring

  • Indragie Karunaratneさん(Sentry)

アプリケーションのデバッグ

  • Sentryはエラーのデバッグを効率よく解決につなげる
    • UXに直結するところ
    • どこに重要なデータがあるか見るべきところを出してくれる
  • パフォーマンス改善の可視化
    • 例えばモバイルアプリの起動時間が遅くなった時どの処理が重いか見れる
  • エラーのトレーシング
    • フロントエンドからバックエンドまで紐づけてトレースできる
  • ログからリプレイする機能
    • モバイルアプリで画面で動きを再現する機能がもうすぐ出る
    • Webはもうある
  • span based metrics

    • もうすぐ出る機能
    • Dynatraceみたいな感じで時系列のデータ見れて深堀っていける
    • 関数レベルのプロファイルも確認できる

      ロダクト「KARTE」でのエラートラッキングのノウハウ

  • 日鼻 旬さん(Plaid)

Sentryの導入

  • SentryとDatadogをどのコンポーネントにも入れている
    • GitHub Issueと連携したり
    • PagerDutyと連携したり
  • 想定されていたこと
    • ノイズが多くて回らなかったり
    • 誰が対応するかわからない
  • アプローチ
    • デプロイ直後に焦点
      • 新しいエラーだと要確認
    • サービスのチームがオーナーシップ持って通知飛ばす
    • エラー数可視化して少しずつ潰していく
      • どのエラーが何回起きてるかとか見える