CloudflareのProject Glasswingを題材に、コーディングエージェントの脆弱性診断における失敗事例を分析。AnthropicのMythosモデルを用いた実務上の課題を解説します。
エージェントに「脆弱性を探して」はなぜ失敗するのか──Cloudflareが50+リポで示したharnessの正体
編集メモ: AIエージェントへの指示が脆弱性診断などで失敗する要因を理解し、現在の技術的な限界と実務における精度の乖離を適切に評価することがエンジニアには求められます。