データセンター不足とAPI利用料の高騰を受け、個人でモデルを運用する手法が注目されている。ミニPC2台を活用して毎日数百万トークンを処理し、コストを削減する現実的なアプローチを考察する。