Xavierの初期値とHeの初期値

Xavierの初期値とHeの初期値は、ニューラルネットワークの重みを初期化するための方法です。これらの初期化方法は、モデルの学習の効率性や性能に影響を与えることが知られています。

点対称で中央付近で線形関数に良いと言われている。 http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf

見かけ上の標準偏差

np.sqrt(2 / (n1 + n2))

広がりを持った初期値となる。

見かけ上の標準偏差

np.sqrt(2 / n1)

ReLU関数の場合

ReLU関数の場合、Xavierの初期値よりHeの初期値の方が良いと言われています。 Xavierの初期値の場合は0付近に偏ってしまいますが、Heの初期値の場合は2,3の方向へと広がります。

Xavierの初期値とHeの初期値は、畳み込みニューラルネットワークや全結合ニューラルネットワークなど、さまざまな種類のネットワークで一般的に使用される初期化手法です。これらの初期化手法は、勾配消失や勾配爆発などの問題を緩和し、ネットワークの学習を安定化させる効果があります。