ローカル音声認識モデルにおける、起動ワード(wake word)の作成と評価についての実践記録。指標上の精度が高くても、実環境で認識率が低い要因の分析と、実体験に基づくモデル改善の難しさを解説しています。
内部 eval 98% なのに実機で死んだ — LiveKit wakeword で自分の声を学習させた話
編集メモ: 音声認識モデルの開発において、指標上の精度と実環境での挙動には乖離があることを示し、現場レベルでの試行錯誤と改善プロセスが不可欠であると説いています。