中国の研究者が、AIがコード品質を長期維持できるかを評価する新しいベンチマークを提案しました。AIによるソフトウェア開発の持続可能性と信頼性を測るための重要な一歩となります。