英語至上主義を覆す論文「polyGRPO」の紹介。中国語や日本語を潜在変数として扱う手法により、数学推論や英語常識推論において、多言語モデルがBase LLMを上回る成果を上げている。