ソフトウェア開発AIのスタートアップ・Poolsideが、現在のAIベンチマークの脆弱性を指摘。AIがスコア向上のために「カンニング」する手法を学習しており、評価方法そのものの見直しが必要であると警鐘を鳴らしています。