「ソフトマックス関数」の版間の差分
ナビゲーションに移動
検索に移動
Administrator (トーク | 投稿記録) |
Administrator (トーク | 投稿記録) |
||
(同じ利用者による、間の2版が非表示) | |||
1行目: | 1行目: | ||
− | '''ソフトマックス関数'''(softmax function)とは、[[ロジスティック関数]]を[[多次元]]に[[一般化]]したもので、K次元の[[実数]][[ベクトル]](K個の[[実数]][[配列]])をK個の確率分布(0.0〜1.0)に変換し、かつその確率分布の合計が1.0になる[[関数]] | + | '''ソフトマックス関数'''(softmax function)とは、[[ロジスティック関数]]を[[多次元]]に[[一般化]]したもので、K次元の[[実数]][[ベクトル]](K個の[[実数]][[配列]])をK個の確率分布(0.0〜1.0)に変換し、かつその確率分布の合計が1.0になる[[関数]]の総称である。最終的な結果は「合計1.0」にはなるが、個々の値は実装により異なる。 |
「softargmax」や「正規化指数関数」などとも呼ばれる。 | 「softargmax」や「正規化指数関数」などとも呼ばれる。 | ||
− | + | 「正規化指数関数」という名称からもわかるように[[Unity]]や[[MonoGame]]なんかで3Dゲームなどを作っているとよく使う[[正規化関数]]「normalize(vector3)」の亜種であり、3次元だけでなく4次元でも5次元でも100次元でも「合計1.0」にしてくれるというもの。[[正規化関数]]をグラフにすると[[直線]]になるが、正規化指数関数は[[曲線]]になる。 | |
[[ニューラルネットワーク]]の最後の[[活性化関数]]として、[[ルースの選択公理]]に基づいて、ネットワークの出力を予測される出力クラスに対する確率分布に正規化するためによく使われる。 | [[ニューラルネットワーク]]の最後の[[活性化関数]]として、[[ルースの選択公理]]に基づいて、ネットワークの出力を予測される出力クラスに対する確率分布に正規化するためによく使われる。 | ||
+ | 数式 | ||
:<math>\sigma(\mathbf{z})_i = \frac{e^{z_i}}{\sum_{j=1}^K e^{z_j}} </math> | :<math>\sigma(\mathbf{z})_i = \frac{e^{z_i}}{\sum_{j=1}^K e^{z_j}} </math> | ||
+ | C# で書くとこんな感じ。 | ||
<source lang="csharp"> | <source lang="csharp"> | ||
float[] softmax(float[] z) | float[] softmax(float[] z) |
2022年9月13日 (火) 01:57時点における最新版
ソフトマックス関数(softmax function)とは、ロジスティック関数を多次元に一般化したもので、K次元の実数ベクトル(K個の実数配列)をK個の確率分布(0.0〜1.0)に変換し、かつその確率分布の合計が1.0になる関数の総称である。最終的な結果は「合計1.0」にはなるが、個々の値は実装により異なる。
「softargmax」や「正規化指数関数」などとも呼ばれる。
「正規化指数関数」という名称からもわかるようにUnityやMonoGameなんかで3Dゲームなどを作っているとよく使う正規化関数「normalize(vector3)」の亜種であり、3次元だけでなく4次元でも5次元でも100次元でも「合計1.0」にしてくれるというもの。正規化関数をグラフにすると直線になるが、正規化指数関数は曲線になる。
ニューラルネットワークの最後の活性化関数として、ルースの選択公理に基づいて、ネットワークの出力を予測される出力クラスに対する確率分布に正規化するためによく使われる。
数式
C# で書くとこんな感じ。
float[] softmax(float[] z)
{
var exp = z.Select(System.MathF.Exp);
var sum_exp = exp.Sum();
var ret = exp.Select(j => j / sum_exp);
return ret.ToArray();
}
// test
var a = new[] { 1.0f, 2.0f, 3.0f, 4.0f, 1.0f, 2.0f, 3.0f };
var b = softmax(a);
Console.WriteLine(String.Join(", ", b));