AIモデルの不適切な応答を防ぐ「検閲」に対し、サードパーティーが開発した「検閲なし」モデルが注目を集めています。しかし、Morgin.aiの調査によると、事後調整で検閲を外しても、事前の学習データに内在するバイアスにより出力が本質的に歪められていることが判明しました。真の意味での「検閲なし」AIの実現には、事前学習段階からの抜本的な見直しが必要であると指摘されています。
「検閲除去版モデル」をアピールするAIモデルがまったく検閲を除去できていないという指摘
編集メモ: 表面的な検閲解除を謳うAIモデルでも、事前学習データに由来するバイアスは回避できないため、AI導入時にはモデルの学習プロセスや本質的な回答傾向を慎重に精査する必要があります。