function callingにおいて、必ずしも巨大なモデルが優れているわけではないことが判明。2026年のベンチマーク結果をもとに、小規模モデルが大規模モデルを上回る精度を出した実例と背景を解説する。