BitNetはLLMの重みを3値に量子化し、メモリ使用量を削減しつつ推論を高速化する技術です。ソースコードに基づき、3値量子化に最適化された内積計算の仕組みを解説します。