이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

convolution2dLayer

2차원 컨벌루션 계층

설명

2차원 컨벌루션 계층은 입력값에 슬라이딩 컨벌루션 필터를 적용합니다. 이 계층은 입력값의 세로와 가로 방향을 따라 필터를 이동하면서 가중치와 입력값의 내적을 계산한 다음 편향 항을 추가하여 입력값을 컨벌루션합니다.

생성

구문

layer = convolution2dLayer(filterSize,numFilters)
layer = convolution2dLayer(filterSize,numFilters,Name,Value)

설명

layer = convolution2dLayer(filterSize,numFilters)는 2차원 컨벌루션 계층을 만들고 FilterSizeNumFilters 속성을 설정합니다.

예제

layer = convolution2dLayer(filterSize,numFilters,Name,Value)는 이름-값 쌍을 사용하여 선택 사항인 Stride, DilationFactor, NumChannels, WeightLearnRateFactor, BiasLearnRateFactor, WeightL2Factor, BiasL2FactorName 속성을 설정합니다. 입력값 채우기를 지정하려면 'Padding' 이름-값 쌍 인수를 사용하십시오. 예를 들어, convolution2dLayer(11,96,'Stride',4,'Padding',1)은 크기가 [11 11]인 필터 96개와 크기가 [4 4]인 스트라이드를 가지며 계층 입력값의 모든 가장자리에 크기 1의 0 채우기를 적용하는 2차원 컨벌루션 계층을 만듭니다. 여러 개의 이름-값 쌍을 지정할 수 있습니다. 각 속성 이름을 작은따옴표로 묶습니다.

입력 인수

모두 확장

이름-값 쌍의 인수

쉼표로 구분된 이름-값 쌍 인수를 사용하여 계층 입력값의 가장자리에 더할 0 채우기의 크기를 지정하거나 Stride, DilationFactor, NumChannels, WeightLearnRateFactor, BiasLearnRateFactor, WeightL2Factor, BiasL2FactorName 속성을 설정할 수 있습니다. 이름을 작은따옴표로 묶습니다.

예: convolution2dLayer(3,16,'Padding','same')은 크기가 [3 3]인 필터 16개를 가지며 'same' 채우기를 적용하는 2차원 컨벌루션 계층을 만듭니다. 훈련 시점에 계층 출력 크기가 입력 크기와 같아지는 0 채우기 크기가 계산되고 설정됩니다.

입력값 가장자리 채우기로, 'Padding'과 함께 다음 값 중 하나가 쉼표로 구분되어 지정됩니다.

  • 'same' — 스트라이드가 1인 경우 출력 크기가 입력 크기와 같아지도록 훈련 시점에 계산한 크기의 채우기가 적용됩니다.스트라이드가 1보다 큰 경우, 출력 크기는 ceil(inputSize/stride)가 됩니다. 여기서 inputSize는 입력값의 높이 또는 너비이고 stride는 대응되는 차원의 스트라이드입니다. 가능한 경우 상하좌우에 동일한 양의 채우기가 적용됩니다. 세로 방향으로 더해야 하는 채우기가 홀수 값을 갖는 경우, 아래에 추가로 채우기가 적용됩니다. 가로 방향으로 더해야 하는 채우기가 홀수 값을 갖는 경우, 오른쪽에 추가로 채우기가 적용됩니다.

  • 음이 아닌 정수 p — 입력값의 모든 가장자리에 크기가 p인 채우기를 더합니다.

  • 음이 아닌 정수로 구성된 벡터 [a b] — 입력값의 위와 아래에 크기가 a인 채우기를 더하고 왼쪽과 오른쪽에 크기가 b인 채우기를 더합니다.

  • 음이 아닌 정수로 구성된 벡터 [t b l r] — 입력값의 위에 크기가 t인 채우기를, 아래에 크기가 b인 채우기를, 왼쪽에 크기가 l인 채우기를, 오른쪽에 크기가 r인 채우기를 더합니다.

예: 'Padding',1은 입력값의 위와 아래에 채우기 한 행을 더하고, 왼쪽과 오른쪽에 채우기 한 열을 더합니다.

예: 'Padding','same'은 (스트라이드가 1인 경우) 출력 크기가 입력 크기와 같아지도록 채우기를 더합니다.

속성

모두 확장

필터의 높이와 너비로, 2개의 양의 정수로 구성된 벡터 [h w]로 지정됩니다. 여기서 h는 높이이고 w는 너비입니다. FilterSize는 입력값에서 뉴런이 연결되는 국소 영역의 크기를 정의합니다.

계층을 만들 때 높이와 너비에 같은 값을 사용하려면 FilterSize를 스칼라로 지정하면 됩니다.

예: [5 5]는 높이가 5이고 너비가 5인 필터를 지정합니다.

필터 개수로, 양의 정수로 지정됩니다. 이 수치는 컨벌루션 계층에서 입력값의 동일한 영역에 연결되는 뉴런의 개수에 대응됩니다. 이 파라미터는 컨벌루션 계층의 출력값에 있는 채널(특징 맵)의 개수를 결정합니다.

예: 96

입력값을 세로와 가로 방향으로 순회하는 스텝 크기로, 2개의 양의 정수로 구성된 벡터 [a b]로 지정됩니다. 여기서 a는 세로 스텝 크기이고 b는 가로 스텝 크기입니다. 계층을 만들 때 세로, 가로 스텝 크기에 모두 같은 값을 사용하려면 Stride를 스칼라로 지정하면 됩니다.

예: [2 3]은 세로 스텝 크기를 2로, 가로 스텝 크기를 3으로 지정합니다.

팽창된 컨벌루션(아트루스 컨벌루션이라고도 함) 인자로, 2개의 양의 정수로 구성된 벡터 [h w]로 지정됩니다. 여기서 h는 세로 팽창이고 w는 가로 팽창입니다. 계층을 만들 때 세로와 가로 팽창에 모두 같은 값을 사용하려면 DilationFactor를 스칼라로 지정하면 됩니다.

파라미터의 개수나 연산량을 늘리지 않으면서 계층의 수용 영역(입력값에서 계층이 볼 수 있는 영역)을 늘리려는 경우 팽창된 컨벌루션을 사용할 수 있습니다.

이 계층은 각 필터 요소 사이에 0을 삽입하여 필터를 확장합니다. 팽창 인자는 입력값 추출을 위한 스텝 크기 또는 이와 동등한 필터 업샘플링 인자를 결정합니다. 팽창 인자에 따라 필터 크기가 (Filter Size – 1) .* Dilation Factor + 1로 정해집니다. 예를 들어, 팽창 인자가 [2 2]인 3x3 필터는 요소들 사이에 0이 삽입된 5x5 필터와 같습니다.

예: [2 3]

입력값 테두리에 적용할 채우기 크기로, 4개의 음이 아닌 정수로 구성된 벡터 [t b l r]로 지정됩니다. 여기서 t는 위에 적용할 채우기이고 b는 아래에 적용할 채우기이고 l은 왼쪽에 적용할 채우기이고 r은 오른쪽에 적용할 채우기입니다.

계층을 만들 때 'Padding' 이름-값 쌍 인수를 사용하여 채우기 크기를 지정합니다.

예: [1 1 2 2]는 입력값의 위와 아래에 채우기 한 행을 더하고, 왼쪽과 오른쪽에 채우기 두 열을 더합니다.

채우기 크기를 결정하는 방법으로, 'manual' 또는 'same'으로 지정됩니다.

계층을 만들 때 사용자가 지정한 'Padding' 값을 기준으로 자동으로 PaddingMode의 값이 설정됩니다.

  • 'Padding' 옵션을 스칼라 또는 음이 아닌 정수로 구성된 벡터로 설정한 경우, 자동으로 PaddingMode'manual'로 설정됩니다.

  • 'Padding' 옵션을 'same'으로 설정한 경우, 자동으로 PaddingMode'same'으로 설정되고, 스트라이드가 1인 경우 출력 크기가 입력 크기와 같아지도록 채우기 크기가 훈련 시점에 계산됩니다. 스트라이드가 1보다 큰 경우, 출력 크기는 ceil(inputSize/stride)가 됩니다. 여기서 inputSize는 입력값의 높이 또는 너비이고 stride는 대응되는 차원의 스트라이드입니다. 가능한 경우 상하좌우에 동일한 양의 채우기가 적용됩니다. 세로 방향으로 더해야 하는 채우기가 홀수 값을 갖는 경우, 아래에 추가로 채우기가 적용됩니다. 가로 방향으로 더해야 하는 채우기가 홀수 값을 갖는 경우, 오른쪽에 추가로 채우기가 적용됩니다.

참고

Padding 속성은 향후 릴리스에서 제거될 예정입니다. PaddingSize를 대신 사용하십시오. 계층을 만들 때 'Padding' 이름-값 쌍 인수를 사용하여 채우기 크기를 지정합니다.

입력값 테두리에 세로와 가로 방향으로 적용할 채우기 크기로, 2개의 음이 아닌 정수로 구성된 벡터 [a b]로 지정됩니다. 여기서 a는 입력 데이터의 위와 아래에 적용할 채우기이고 b는 왼쪽과 오른쪽에 적용할 채우기입니다.

예: [1 1]은 입력값의 위와 아래에 채우기 한 행을 더하고, 왼쪽과 오른쪽에 채우기 한 열을 더합니다.

각 필터의 채널 개수로, 'auto' 또는 양의 정수로 지정됩니다.

이 파라미터는 컨벌루션 계층으로 입력되는 입력값의 채널 개수와 항상 같습니다. 예를 들어, 입력값이 컬러 이미지인 경우, 입력값의 채널 개수는 3입니다. 현재 계층 전에 컨벌루션 계층의 필터 개수가 16이라면, 현재 계층의 채널 개수는 16입니다.

NumChannels'auto'인 경우, 소프트웨어가 훈련 시점에 채널 개수를 결정합니다.

예: 256

계층 이름으로, 문자형 벡터 또는 string형 스칼라로 지정됩니다. 계층 그래프에 계층을 포함하려면 비어 있지 않은 고유한 계층 이름을 지정해야 합니다. 이 계층을 사용하여 시리즈 네트워크를 훈련시킬 때 Name''로 설정하면, 소프트웨어가 훈련 시점에 해당 계층에 자동으로 이름을 할당합니다.

데이터형: char | string

컨벌루션 계층의 계층 가중치로, FilterSize(1)xFilterSize(2)xNumChannelsxNumFilters 배열로 지정됩니다.

이 속성은 이름-값 쌍 인수를 사용하여 설정할 수 없습니다.

데이터형: single | double

컨벌루션 계층의 계층 편향으로, 1x1xNumFilters 배열로 지정됩니다.

이 속성은 이름-값 쌍 인수를 사용하여 설정할 수 없습니다.

데이터형: single | double

가중치에 대한 학습률 인자로, 음이 아닌 스칼라로 지정됩니다.

이 인자에 전역 학습률을 곱하여 이 계층의 가중치에 대한 학습률이 결정됩니다. 예를 들어, WeightLearnRateFactor가 2인 경우, 이 계층의 가중치에 대한 학습률은 현재 전역 학습률의 2배입니다. 소프트웨어는 trainingOptions 함수로 지정된 설정을 기준으로 전역 학습률을 결정합니다.

예: 2

편향에 대한 학습률 인자로, 음이 아닌 스칼라로 지정됩니다.

이 인자에 전역 학습률을 곱하여 이 계층의 편향에 대한 학습률이 결정됩니다. 예를 들어, BiasLearnRateFactor가 2인 경우, 이 계층의 편향에 대한 학습률은 현재 전역 학습률의 2배입니다. 소프트웨어는 trainingOptions 함수로 지정된 설정을 기준으로 전역 학습률을 결정합니다.

예: 2

가중치에 대한 L2 정규화 인자로, 음이 아닌 스칼라로 지정됩니다.

이 인자에 전역 L2 정규화 인자를 곱하여 이 계층의 가중치에 대한 학습률이 결정됩니다. 예를 들어, WeightL2Factor가 2인 경우, 이 계층의 가중치에 대한 L2 정규화는 전역 L2 정규화의 2배입니다. 전역 L2 정규화 인자는 trainingOptions 함수를 사용하여 지정할 수 있습니다.

예: 2

편향에 대한 L2 정규화 인자로, 음이 아닌 스칼라로 지정됩니다.

이 인자에 전역 L2 정규화 인자를 곱하여 이 계층의 편향에 대한 학습률이 결정됩니다. 예를 들어, BiasL2Factor가 2인 경우, 이 계층의 편향에 대한 L2 정규화는 전역 L2 정규화의 2배입니다. 전역 L2 정규화 인자는 trainingOptions 함수를 사용하여 지정할 수 있습니다.

예: 2

예제

모두 축소

높이와 너비가 11인 필터 96개를 갖는 컨벌루션 계층을 만듭니다. 가로 방향과 세로 방향에서 크기가 4인 스트라이드(스텝 크기)를 사용합니다.

layer = convolution2dLayer(11,96,'Stride',4)
layer = 
  Convolution2DLayer with properties:

              Name: ''

   Hyperparameters
        FilterSize: [11 11]
       NumChannels: 'auto'
        NumFilters: 96
            Stride: [4 4]
    DilationFactor: [1 1]
       PaddingMode: 'manual'
       PaddingSize: [0 0 0 0]

   Learnable Parameters
           Weights: []
              Bias: []

  Show all properties

Layer 배열에 컨벌루션 계층을 포함시킵니다.

layers = [ ...
    imageInputLayer([28 28 1])
    convolution2dLayer(5,20)
    reluLayer
    maxPooling2dLayer(2,'Stride',2)
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer]
layers = 
  7x1 Layer array with layers:

     1   ''   Image Input             28x28x1 images with 'zerocenter' normalization
     2   ''   Convolution             20 5x5 convolutions with stride [1  1] and padding [0  0  0  0]
     3   ''   ReLU                    ReLU
     4   ''   Max Pooling             2x2 max pooling with stride [2  2] and padding [0  0  0  0]
     5   ''   Fully Connected         10 fully connected layer
     6   ''   Softmax                 softmax
     7   ''   Classification Output   crossentropyex

높이와 너비가 5인 필터 32개를 갖는 컨벌루션 계층을 만듭니다. 입력 이미지의 테두리를 따라 크기가 2인 채우기를 지정합니다. 편향에 대한 학습률 인자를 2로 설정합니다. 표준편차가 0.0001인 가우스 분포로부터 가중치를 수동으로 초기화합니다.

layer = convolution2dLayer(5,32,'Padding',2,'BiasLearnRateFactor',2)
layer = 
  Convolution2DLayer with properties:

              Name: ''

   Hyperparameters
        FilterSize: [5 5]
       NumChannels: 'auto'
        NumFilters: 32
            Stride: [1 1]
    DilationFactor: [1 1]
       PaddingMode: 'manual'
       PaddingSize: [2 2 2 2]

   Learnable Parameters
           Weights: []
              Bias: []

  Show all properties

입력값이 컬러 이미지를 포함한다고 가정하겠습니다. 표준편차가 0.0001인 가우스 분포로부터 가중치를 수동으로 초기화합니다.

layer.Weights = randn([5 5 3 32]) * 0.0001;

계층의 국소 영역의 크기는 5x5입니다. 각 영역의 컬러 채널 개수는 3입니다. 특징 맵의 개수는 32(필터의 개수)입니다. 따라서 이 계층에는 5 * 5 * 3 * 32개의 가중치가 있습니다.

randn([5 5 3 32])는 평균이 0이고 표준편차가 1인 가우스 분포에서 얻은 값으로 구성된 5x5x3x32 배열을 반환합니다. 이 값들에 0.0001을 곱하면 가우스 분포의 표준편차가 0.0001이 됩니다.

이와 마찬가지로, 평균이 1이고 표준편차가 0.00001인 가우스 분포로부터 편향을 초기화합니다.

layer.Bias = randn([1 1 32])*0.00001 + 1;

이 예제에서는 특징 맵이 32개 있으므로 편향도 32개 있습니다. randn([1 1 32])는 평균이 0이고 표준편차가 1인 가우스 분포로부터 얻은 값으로 구성된 1x1x32 배열을 반환합니다. 이 값들에 0.00001을 곱하면 값들의 표준편차가 0.00001이 되고, 1을 더하면 가우스 분포의 평균이 1이 됩니다.

입력값의 크기가 28x28x1이라고 가정하겠습니다. 높이가 6이고 너비가 4인 필터 16개를 갖는 컨벌루션 계층을 만듭니다. 가로와 세로 방향의 스트라이드를 4로 설정합니다.

컨벌루션이 입력값을 완전히 덮도록 해야 합니다. 컨벌루션이 입력값을 완전히 덮으려면 가로와 세로 출력 크기가 모두 정수가 되어야 합니다. 가로 출력 크기가 정수가 되기 위해서는 이미지의 위와 아래에 0 채우기 한 행이 필요합니다. (28 – 6+ 2 * 1)/4 + 1 = 7. 세로 출력 크기가 정수가 되기 위해서는 0 채우기가 필요하지 않습니다. (28 – 4+ 2 * 0)/4 + 1 = 7.

컨벌루션 계층을 생성합니다.

layer = convolution2dLayer([6 4],16,'Stride',4,'Padding',[1 0])
layer = 
  Convolution2DLayer with properties:

              Name: ''

   Hyperparameters
        FilterSize: [6 4]
       NumChannels: 'auto'
        NumFilters: 16
            Stride: [4 4]
    DilationFactor: [1 1]
       PaddingMode: 'manual'
       PaddingSize: [1 1 0 0]

   Learnable Parameters
           Weights: []
              Bias: []

  Show all properties

세부 정보

모두 확장

참고 문헌

[1] LeCun, Y., B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard, and L. D. Jackel. "Handwritten Digit Recognition with a Back-Propagation Network." In Advances in Neural Information Processing Systems 2 (D. Touretzky, ed.). San Francisco: Morgan Kaufmann, 1990.

[2] LeCun, Y., L. Bottou, Y. Bengio, and P. Haffner. ''Gradient-Based Learning Applied to Document Recognition.'' Proceedings of the IEEE. Vol. 86, Number 11, 1998, pp. 2278–2324.

[3] Murphy, K. P. Machine Learning: A Probabilistic Perspective. Cambridge, MA: MIT Press, 2012.

R2016a에 개발됨


[1] Image credit: Convolution arithmetic (License)