RAGやドキュメント処理におけるPDF解析の難しさを解説。PDFは描画命令の集合体であり意味構造を持たないため、LLMが理解可能なドキュメントへと再構築する前処理レイヤー(PDF4LLMなど)の重要性と実装の要点を論じる。