推論モデルの利用料金が高い原因は「推論トークン」にあると解説。出力が短くても内部でトークンが消費される仕組みを理解し、タスクに応じたモデルの使い分けを推奨する。