PDFのOCR処理で後半が崩れる原因は読み取り精度ではなく「出力の長さ」にあると指摘。Baiduが公開した3Bパラメータのモデル「Unlimited OCR」を例に、コンテキスト長と推論精度の重要性を解説する。