AIに自己評価させたら全部8〜10点だった。採点基準を明示したら現実を突きつけられた話

入門 Zenn LLM 2026-04-29T09:37:46 約1分

編集メモ: AIによる自己評価を実務で有効活用するには、曖昧な指示を避け、具体的なルーブリック（評価基準）をプロンプトに組み込むことで、客観的で現実的なフィードバックを引き出す工夫が求められます。

AIの自己評価が甘くなる問題に対し、具体的な採点基準（ルーブリック）を設けて客観性を高める手法を提案。スパイジャイルモデリングの一環として、LLMを自身の業務やプロジェクト成果の評価に活用し、現実的なフィードバックを得るためのプロンプト設計を解説する。

関連記事