【元記事】(https://zenn.dev/mizchi/articles/empirical-prompt-tuning)
3行まとめ
- プロンプト作成後に別セッションで使うと再現性がない問題を、AIに自動チューニングさせる手法で解決する
- 別のAIに実際にプロンプトを実行させ、不明瞭点をレポートさせる反復ループで精度を向上させる
- 8つのスキルで初稿50点→80〜90点に底上げでき、TDDと同じ構造で暗黙知を排除できる
要約
背景・課題
- プロンプト作成直後は「これで伝わるはず」と思っても、別のセッションで使うと暗黙知が不足し再現性がない
- 書き手は思い込みバイアスで自己評価できない
アプローチ
- 別のAIに実際にプロンプトを実行させ、不明瞭点や裁量補完箇所をレポートさせる
- 要件チェックリストで客観的評価を行い、反復ループで段階的に改善する(TDDと同じ構造)
成果・ポイント
- 8つのスキルで初稿50点→80〜90点に底上げ、「連続2回で新規不明瞭点がゼロ」で収束判定
- 修正波及範囲は構造に依存し、見積もり時は評価基準の文言を詳細化することが重要