「ソフトマックス関数」の版間の差分
Administrator (トーク | 投稿記録) |
Administrator (トーク | 投稿記録) 編集の要約なし |
||
| (同じ利用者による、間の3版が非表示) | |||
| 1行目: | 1行目: | ||
'''ソフトマックス関数'''(softmax function)とは、[[ロジスティック関数]]を[[多次元]]に[[一般化]]したもので、K次元の[[実数]][[ベクトル]](K個の[[実数]][[配列]])をK個の確率分布(0.0〜1.0)に変換し、かつその確率分布の合計が1.0になる[[関数]] | '''ソフトマックス関数'''(softmax function)とは、[[ロジスティック関数]]を[[多次元]]に[[一般化]]したもので、K次元の[[実数]][[ベクトル]](K個の[[実数]][[配列]])をK個の確率分布(0.0〜1.0)に変換し、かつその確率分布の合計が1.0になる[[関数]]の総称である。最終的な結果は「合計1.0」にはなるが、個々の値は実装により異なる。 | ||
「softargmax」や「正規化指数関数」などとも呼ばれる。 | 「softargmax」や「正規化指数関数」などとも呼ばれる。 | ||
「正規化指数関数」という名称からもわかるように[[Unity]]や[[MonoGame]]なんかで3Dゲームなどを作っているとよく使う[[正規化関数]]「normalize(vector3)」の亜種であり、3次元だけでなく4次元でも5次元でも100次元でも「合計1.0」にしてくれるというもの。[[正規化関数]]をグラフにすると[[直線]]になるが、正規化指数関数は[[曲線]]になる。 | |||
[[ニューラルネットワーク]]の最後の[[活性化関数]]として、[[ルースの選択公理]]に基づいて、ネットワークの出力を予測される出力クラスに対する確率分布に正規化するためによく使われる。 | [[ニューラルネットワーク]]の最後の[[活性化関数]]として、[[ルースの選択公理]]に基づいて、ネットワークの出力を予測される出力クラスに対する確率分布に正規化するためによく使われる。 | ||
数式 | |||
:<math>\sigma(\mathbf{z})_i = \frac{e^{z_i}}{\sum_{j=1}^K e^{z_j}} </math> | |||
C# で書くとこんな感じ。 | |||
<source lang="csharp"> | |||
float[] softmax(float[] z) | |||
{ | |||
var exp = z.Select(System.MathF.Exp); | |||
var sum_exp = exp.Sum(); | |||
var ret = exp.Select(j => j / sum_exp); | |||
return ret.ToArray(); | |||
} | |||
// test | |||
var a = new[] { 1.0f, 2.0f, 3.0f, 4.0f, 1.0f, 2.0f, 3.0f }; | |||
var b = softmax(a); | |||
Console.WriteLine(String.Join(", ", b)); | |||
</source> | |||
== 関連項目 == | |||
* [[シグモイド関数]] | |||
[[category: 算数]] | |||