疑似量子コンピュータ(QUBO)を用いて、MoE型LLMのエキスパート配置を最適化する研究。キャッシュ置換アルゴリズム(LRU)の代替として、学習型の予測器を活用することで推論効率を高める試みです。実験結果と具体的な手法の考察を共有します。