Amazon S3とBedrockを用いた法律RAGシステムの構築記録。データを増やすだけでは精度が向上しない実態や、自動評価の限界、チャンキング手法の重要性を解説。構造に基づいたチャンキング導入による改善プロセスと、システム開発における技術的知見を共有する。
RAGの精度を上げる:全法律を入れたら基本問題を落とした話と、チャンキングでの立て直し
編集メモ: RAG構築では単なるデータ投入ではなく、チャンキング手法の最適化と継続的な評価が精度向上に直結し、技術的検証を繰り返す姿勢が求められる。