<div class="dln" itemprop="articleBody"><div class="shdw top"> </div><p>ユークリッド距離のこと
</p><div class="mth Ktx">
$$ \sum_{i=1}^{N}(Xi - Yi)^2 $$
</div><div class="shdw btm"> </div><button type="button" class="mxmz icn_ btn_mxmz"></button></div>

L2ノルム

<div class="dln" itemprop="articleBody"><div class="shdw top"> </div><p><a class="oln" data-kno="K#/01EF" href="/01EF" rel="nofollow">損失関数の微分</a>を<a class="oln" data-kno="K#/DAD8" href="/DAD8" rel="nofollow">数値微分</a>でやってたら計算に1分15秒とかかかっていたのが、ちゃんと微分するようにしたら4秒とかになった。ただし損失関数は<a class="oln" data-kno="K#/9A14" href="/9A14" rel="nofollow">コサイン類似度</a>から<a class="oln" data-kno="K#/8EB1" href="/8EB1" rel="nofollow">L2ノルム</a>に変更になった。
</p><div class="shdw btm"> </div><button type="button" class="mxmz icn_ btn_mxmz"></button></div>

<div class="dln" itemprop="articleBody"><div class="shdw top"> </div><p class="no_idt">学習に用いる損失関数はL2ノルムつかっちゃうのが一般的だし、計算が早いし、単純だしなんだけど、なんか痒い。
<br>最終的に出力の評価はコサイン類似度つかうから、コサイン類似度から損失関数作ってぶちこもうぜとなってる。
</p><p class="no_idt">いまいまは損失関数にL2ノルムつかってみてるけど、ちょっと学習率を強めにすると、パラメーターが発散しちゃってうまく学習できてない。
<br>発散しないようにいい感じ™️の正則化項をもうけてやるのが現実解なんだろうなぁ……
</p><div class="shdw btm"> </div><button type="button" class="mxmz icn_ btn_mxmz"></button></div>

t_wの輪郭

L2ノルム

あれ

あれ