【元記事】(https://zenn.dev/seeda_yuto/articles/otel-ai-agent-observability)
3行まとめ
- Claude CodeのセッションログをOpenTelemetryのスパン階層に変換し、Jaegerで可視化する実験を実施した
- Bash呼び出しが全体の69%、サブエージェント待ちが累計25分のボトルネックと判明した
- 「中身ではなくサイズを記録」「カテゴリで束ねる」など他のAIエージェント実装でも流用可能な設計テンプレートを提示
要約
背景・課題
- Claude Codeを導入して生産性は向上したが「何が遅いのか」「どこで詰まっているのか」という実行内容の詳細が不可視だった
- WebサービスのOpenTelemetry(OTel)をAIエージェントにも適用できるのではという発想から実験を開始
アプローチ
- Claude CodeのセッションログJSONLをOTelのスパン階層(session > turn > tool_call)に変換
- プライバシー重視で会話テキストやファイルパスは記録せず「サイズ」のみを属性として記録、Jaegerで可視化
成果・ポイント
- Bash呼び出しが全体の69%を占め、サブエージェント待ちが累計25分のボトルネックと判明
- エラー率12.3%で複数回リトライが発生、キャッシュ効率は99.6%と高効率