ローカル環境でGemma 4 E2Bを動かし、長文要約を試みた失敗談。クラウドサービスと比較した際の圧倒的な速度差と、自身のローカルLLM構築の現実的な課題を計測結果とともに共有する。
ローカルLLMで長文を要約しようとしたら、とてつもなく時間がかかった話
編集メモ: ローカルLLMの構築と実行には相応のハードウェア性能とコストが伴うため、プロジェクトの実装においてはクラウドとの性能差を把握し、要件に適したインフラ選択を行う賢明な判断が不可欠です。