MicrosoftのVS Code Eval Teamが、コーディングエージェントの「トークン浪費」問題を調査。5万回以上の検証から「過剰思考」の実態を明らかにし、評価自動化の重要性を提言。
5万回の評価で判明 VS Code開発チームが明かす「小型AI」の罠
編集メモ: コーディングエージェントの運用では、小型モデルによる過剰な思考がトークン消費を増大させるため、自動評価システムを導入してコストと精度の最適化を図る必要があります。
MicrosoftのVS Code Eval Teamが、コーディングエージェントの「トークン浪費」問題を調査。5万回以上の検証から「過剰思考」の実態を明らかにし、評価自動化の重要性を提言。