AlexNet

提供: MonoBook
ナビゲーションに移動 検索に移動

AlexNetとは、画像認識競技会「ILSVRC」の2012年大会で優勝したCNNアルゴリズム)である。

論文[編集 | ソースを編集]

構造[編集 | ソースを編集]

層名 種類 フィルタサイズ パディング ストライド 出力数 出力サイズ 備考
input 入力層 (224, 224, 3) 入力層は「224x224x3」(横224 x 縦224 x RGB3色)
conv1 畳み込み層 (11, 11) (4, 4) 96 (55, 55, 96) ReLU
norm1 正規化層 (55, 55, 96) LRN
pool1 プーリング層 (3, 3) (2, 2) (27, 27, 96) MaxPooling
conv2 畳み込み層 (5, 5) (1, 1) (1, 1) 256 (13, 13, 256) ReLU
norm2 正規化層 (13, 13, 256) LRN
pool2 プーリング層 (3, 3) (2, 2) (13, 13, 256) MaxPooling
conv3 畳み込み層 (3, 3) (1, 1) (1, 1) 384 (13, 13, 384) ReLU
conv4 畳み込み層 (3, 3) (1, 1) (1, 1) 384 (13, 13, 384) ReLU
conv5 畳み込み層 (3, 3) (1, 1) (1, 1) 256 (13, 13, 256) ReLU
pool3 プーリング層 (1, 1) (2, 2) (6, 6, 256) MaxPooling
fc1 全結合層 4096 (4096) Dropout
fc2 全結合層 4096 (4096) Dropout
fc3 全結合層 1000 (1000) Softmax