論文「Saliency-Aware Regularized Quantization Calibration for Large Language Models」の技術メモ。LLMの量子化において、重要度を考慮したキャリブレーション手法の理論と実験結果をまとめたもの。