MicrosoftのVS Code Eval Teamが、コーディングエージェントの「トークン浪費」問題を調査。5万回以上の検証から「過剰思考」の実態を明らかにし、評価自動化の重要性を提言。