HuggingFaceに公開されたMiniMax-M3の概要と特徴を解説。総パラメータ数428Bに対しアクティブパラメータが23BというMoE構成を持ち、効率的な推論が可能なモデルです。ライセンス情報や量子化版の利用状況についても触れています。
MiniMax M3のオープンウェイトが公開、1M文脈を支えるMSAを読む
編集メモ: MiniMax-M3は428Bの巨大構成ながらアクティブパラメータを23Bに抑えたMoEモデルであり、高精度と推論コストの効率的な両立を求めるエンジニアにとって注目すべき選択肢となります。