中国の研究者が、AIがコード品質を長期維持できるかを評価する新しいベンチマークを提案しました。AIによるソフトウェア開発の持続可能性と信頼性を測るための重要な一歩となります。
AIの“長期的なコードの保守能力”はどれほどか? 新たな評価テスト「SWE-CI」 中国チームが提案
編集メモ: AIが生成したコードの長期的な保守性を評価する新しいベンチマークは、AIによるソフトウェア開発の信頼性と持続可能性を確保する上で極めて重要。
中国の研究者が、AIがコード品質を長期維持できるかを評価する新しいベンチマークを提案しました。AIによるソフトウェア開発の持続可能性と信頼性を測るための重要な一歩となります。