ITエンジニア ノイのブログ

ITエンジニアのノイです。 YouTubeで ITエンジニアのお勉強という学習用の動画を公開しています。チャンネル登録お願いします!https://m.youtube.com/channel/UCBKfJIMVWXd3ReG_FDh31Aw/playlists

Xavierの初期値とHeの初期値

Xavierの初期値とHeの初期値

Xavierの初期値とHeの初期値は、ニューラルネットワークの重みを初期化するための方法です。これらの初期化方法は、モデルの学習の効率性や性能に影響を与えることが知られています。

Xavierの初期値

点対称で中央付近で線形関数に良いと言われている。 http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf

見かけ上の標準偏差

np.sqrt(2 / (n1 + n2))

Heの初期値

広がりを持った初期値となる。

https://arxiv.org/pdf/1502.01852.pdf

見かけ上の標準偏差

np.sqrt(2 / n1)

ReLU関数の場合

ReLU関数の場合、Xavierの初期値よりHeの初期値の方が良いと言われています。 Xavierの初期値の場合は0付近に偏ってしまいますが、Heの初期値の場合は2,3の方向へと広がります。

Xavierの初期値の場合

Xavierの初期値とHeの初期値は、畳み込みニューラルネットワークや全結合ニューラルネットワークなど、さまざまな種類のネットワークで一般的に使用される初期化手法です。これらの初期化手法は、勾配消失や勾配爆発などの問題を緩和し、ネットワークの学習を安定化させる効果があります。

youtu.be