大規模なRustコードベースをLLMに渡しバグ修正を試みた結果の検証記録。Claude OpusとGemini Flashを用いても、自信満々に間違った回答をする事例が発生した経緯と、その教訓をまとめました。
LLMに大量ファイルを渡してバグ探しさせたら「バグなし」と返ってきた話
編集メモ: 大規模コードベースへのLLM適用にはハルシネーションのリスクが伴うため、AIを盲信せず、人間による検証と責任ある実装のプロセスが不可欠であることを再認識すべきです。