OCR+LLMの誤抽出を「一度直せば二度目から自動補正」する

上級 Zenn LLM 2026-07-01T06:21:04 約1分

編集メモ: OCRとLLMを組み合わせるシステムでは、ユーザーの修正履歴を学習データとして蓄積・再利用する設計にすることで、業務効率と精度を継続的に向上させることができる。

PDF自動分割・抽出パイプラインにおいて、ユーザーの修正操作を学習データとしてDBへ蓄積し、次回以降の抽出結果を自動補正するプロトタイプ実装を紹介。

関連記事