Qwen3、LLM-jp-4、Gemma3の3モデルを物理学の専門知識で比較検証。汎用ベンチマークではなく、専門領域での回答精度と誤り方を赤入れし、実務利用の観点からモデルの特性を深掘りする。
ローカルLLM3モデルを物性物理の質問でファクトチェック|Qwen3・LLM-jp-4・Gemma3
編集メモ: 専門分野でのLLM活用においては、汎用的なベンチマークよりも実務に近い環境でのファクトチェックが重要であり、各モデルの誤回答の傾向を理解することがビジネス実装の成否を分けます。