深層学習における汎化性能の謎を解く「Sharp Minima仮説」を解説。大バッチ学習と再パラメータ化を用いた研究成果に基づき、なぜニューラルネットワークが未知のデータに対しても高い精度を発揮するのかを深掘りします。