【元記事】(https://qiita.com/shinkai_/items/626dfa7857f2d554784e)
3行まとめ
- GitHub Copilotが2026年6月から従量課金(AI Credits)に移行し、Agent mode多用者は実質大幅値上げに
- トークン削減の4手法(Caveman Prompt・プロンプトキャッシング・モデルルーティング・サブエージェント分離)を解説
- コード補完は無料維持。簡潔さを制約すると大型モデルの精度が上がるケースもある
要約
背景・課題
- GitHub Copilotが6/1からAI Credits方式の従量課金に移行。Claude Sonnetは旧制度比9倍、Opusは27倍のクレジット消費が報告されている
アプローチ
- Caveman Prompt(原始人語で出力圧縮、最大75%削減)、プロンプトキャッシング(静的要素を先頭に配置)、モデルルーティング(Auto modeで適材適所)、サブエージェント分離(調査を委任しコンテキスト汚染防止)の4手法
成果・ポイント
- コード補完は無料のまま。設計書→コードにはキャッシング、コード→設計書にはサブエージェント分離が有効。複数手法の組み合わせも可能