「llm-jp-4-vl-9b-beta」モデルをLoRAで微調整するための学習データセット提案。jagle・FineVisionで使用済みのデータを除外し、汎用タスクを目的としている。ライセンスや翻訳品質基準等の詳細要件も定義済み。
個人でllm-jp-4-vl-9b-betaをFTしてみる ── 学習データ収集の試行錯誤
編集メモ: 汎用的な国産LLMの微調整には、高品質なデータ選定とライセンス遵守が不可欠であり、戦略的なデータセット構築がAI活用の競争力を左右します。