AIの自己評価が甘くなる問題に対し、具体的な採点基準(ルーブリック)を設けて客観性を高める手法を提案。スパイジャイルモデリングの一環として、LLMを自身の業務やプロジェクト成果の評価に活用し、現実的なフィードバックを得るためのプロンプト設計を解説する。
AIに自己評価させたら全部8〜10点だった。採点基準を明示したら現実を突きつけられた話
編集メモ: AIによる自己評価を実務で有効活用するには、曖昧な指示を避け、具体的なルーブリック(評価基準)をプロンプトに組み込むことで、客観的で現実的なフィードバックを引き出す工夫が求められます。