マルチモーダルLLMを活用した非構造化データ処理の現状と展望。従来の手法と比較して、少ない前処理で現場の画像や音声データを扱う可能性と、実用化に向けた課題を論じる。