Zhipu AIのオープンウェイトモデルが、IDOR検出ベンチマークでフロンティアモデルを上回った事例を紹介。Semgrepチームによる比較検証を通じ、オープンソースモデルの実力とセキュリティ分野での活用可能性を解説する。
GLM 5.2がClaudeを超えた:IDORベンチマークで判明したオープンウェイトの実力
編集メモ: オープンウェイトモデルが特定の専門タスクで商用モデルを凌駕する実力を示しており、セキュリティ等の特定用途で選択肢に加えるべき段階です。