PDF自動分割・抽出パイプラインにおいて、ユーザーの修正操作を学習データとしてDBへ蓄積し、次回以降の抽出結果を自動補正するプロトタイプ実装を紹介。
OCR+LLMの誤抽出を「一度直せば二度目から自動補正」する
編集メモ: OCRとLLMを組み合わせるシステムでは、ユーザーの修正履歴を学習データとして蓄積・再利用する設計にすることで、業務効率と精度を継続的に向上させることができる。
PDF自動分割・抽出パイプラインにおいて、ユーザーの修正操作を学習データとしてDBへ蓄積し、次回以降の抽出結果を自動補正するプロトタイプ実装を紹介。