Anthropicは、AIモデル内の複雑な数値データ(活性化値)を人間が理解できる自然言語に翻訳する「自然言語オートエンコーダー(NLAs)」を発表しました。AIの思考の可読性が高まります。