GoogleはAndroid開発タスクの性能を評価するためのベンチマーク「Android Bench」を公開しました。GitHub上の実際の開発課題を基にしており、LLMの技術的な適合性や課題解決能力を正確に測定可能です。