AIの安全制御は違法行為への回答を拒否するが、一部のオープンウェイトモデルでは数分で安全ガードレールを取り外せることがFinancial Times等のテストで判明した。
MetaやGoogleのAI安全対策がGitHub公開ツールで解除できるとの報告
編集メモ: 主要なAIモデルの安全対策が容易に解除可能であるという現実は、AIを活用する企業が自社で多層的なフィルタリングやガードレールを設ける重要性を改めて示唆しています。
AIの安全制御は違法行為への回答を拒否するが、一部のオープンウェイトモデルでは数分で安全ガードレールを取り外せることがFinancial Times等のテストで判明した。