Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

activations

딥러닝 신경망 계층 활성화 계산

설명

CPU 또는 GPU에서 딥러닝 신경망 계층 활성화를 계산할 수 있습니다. GPU를 사용하려면 Parallel Computing Toolbox™ 라이선스와 지원되는 GPU 장치가 필요합니다. 지원되는 장치에 대한 자세한 내용은 GPU 연산 요구 사항 (Parallel Computing Toolbox) 항목을 참조하십시오. 하드웨어 요구 사항은 이름-값 인수 ExecutionEnvironment를 사용하여 지정하십시오.

훈련된 SeriesNetwork 또는 DAGNetwork를 사용하여 활성화 결과를 구하려면 activations 함수를 사용하십시오. dlnetwork 객체의 활성화 결과를 구하려면 forward 함수 또는 predict 함수를 사용하고 Outputs 옵션을 지정하십시오.

act = activations(net,images,layer)는 지정된 영상을 사용하여 이름 또는 번호가 layer인 계층의 신경망 활성화 결과를 반환합니다.

act = activations(net,sequences,layer)는 지정된 시퀀스를 사용하여 계층의 신경망 활성화 결과를 반환합니다.

act = activations(net,features,layer)는 지정된 특징 데이터를 사용하여 계층의 신경망 활성화 결과를 반환합니다.

act = activations(net,X1,...,XN,layer)는 다중 입력 신경망 net에 대해 숫자형 배열 또는 셀형 배열인 X1, ..., XN의 데이터를 사용하여 계층의 신경망 활성화 결과를 반환합니다. 입력값 Xi는 신경망 입력값 net.InputNames(i)에 대응됩니다.

act = activations(net,mixed,layer)는 혼합된 데이터형의 입력값을 여러 개 갖는 훈련된 신경망 net을 사용하여 계층의 신경망 활성화 결과를 반환합니다.

예제

act = activations(___,Name=Value)는 하나 이상의 이름-값 쌍 인수로 지정된 추가 옵션을 사용하여 신경망 활성화 결과를 반환합니다. 예를 들어, OutputAs="rows"는 활성화 출력 형식을 "rows"로 지정합니다. 이 구문은 위에 열거된 구문의 모든 입력 인수와 함께 사용하십시오. 이름-값 인수는 다른 모든 입력 인수 다음에 지정하십시오.

예제

모두 축소

이 예제에서는 사전 훈련된 컨벌루션 신경망에서 학습된 영상 특징을 추출한 다음 추출한 특징을 사용하여 영상 분류기를 훈련시키는 방법을 보여줍니다.

특징 추출은 사전 훈련된 심층 신경망의 강력한 표현 기능을 가장 쉽고 빠르게 사용하는 방법입니다. 예를 들어, 추출된 특징에 대해 fitcecoc(Statistics and Machine Learning Toolbox™)를 사용하여 서포트 벡터 머신(SVM)을 훈련시킬 수 있습니다. 특징 추출은 데이터를 한 번만 통과하면 되므로 신경망 훈련을 가속할 GPU가 없을 때 시도할 수 있는 좋은 출발점이 됩니다.

데이터 불러오기

샘플 영상의 압축을 풀고 영상 데이터저장소로서 불러옵니다. imageDatastore는 폴더 이름을 기준으로 영상에 자동으로 레이블을 지정하고 데이터를 ImageDatastore 객체로 저장합니다. 영상 데이터저장소를 사용하면 메모리에 담을 수 없는 데이터를 포함하여 다량의 영상 데이터를 저장할 수 있습니다. 데이터를 훈련 데이터 70%와 테스트 데이터 30%로 분할합니다.

unzip("MerchData.zip");

imds = imageDatastore("MerchData", ...
    IncludeSubfolders=true, ...
    LabelSource="foldernames");

[imdsTrain,imdsTest] = splitEachLabel(imds,0.7,"randomized");

이 매우 작은 데이터 세트에는 이제 55개의 훈련 영상과 20개의 검증 영상이 있습니다. 샘플 영상 몇 개를 표시합니다.

numImagesTrain = numel(imdsTrain.Labels);
idx = randperm(numImagesTrain,16);

I = imtile(imds,"Frames",idx);

figure
imshow(I)

사전 훈련된 신경망 불러오기

사전 훈련된 SqueezeNet 신경망을 불러옵니다. 1백만 개가 넘는 영상에 대해 훈련된 SqueezeNet은 영상을 키보드, 마우스, 연필, 각종 동물 등 1,000가지 사물 범주로 분류할 수 있습니다. 그 결과 이 모델은 다양한 영상을 대표하는 다양한 특징을 학습했습니다.

net = squeezenet;

신경망 아키텍처를 분석합니다.

analyzeNetwork(net)

2022-01-07_16-31-30.png

첫 번째 계층인 영상 입력 계층에 입력되는 영상은 크기가 227×227×3이어야 합니다. 여기서 3은 색 채널의 개수입니다.

inputSize = net.Layers(1).InputSize
inputSize = 1×3

   227   227     3

영상 특징 추출하기

신경망은 입력 영상에 대한 계층 표현을 생성합니다. 보다 심층의 계층에는 앞쪽 계층의 하위 수준 특징을 사용하여 생성한 상위 수준의 특징이 포함됩니다. 훈련 영상과 테스트 영상의 특징 표현을 가져오려면 전역 평균값 풀링 계층 "pool10"에서 activations를 사용하십시오. 영상의 하위 수준 표현을 가져오려면 신경망의 앞쪽 계층을 사용하십시오.

이 신경망의 입력 영상은 크기가 227×227×3이 되어야 하는데 영상 데이터저장소의 영상은 이와 다른 크기를 갖습니다. 신경망에 입력하기 전에 훈련 영상과 테스트 영상의 크기를 자동으로 조정하려면 증대된 영상 데이터저장소를 만들고 원하는 영상 크기를 지정한 다음 이러한 데이터저장소를 activations에 대한 입력 인수로 사용하십시오.

augimdsTrain = augmentedImageDatastore(inputSize(1:2),imdsTrain);
augimdsTest = augmentedImageDatastore(inputSize(1:2),imdsTest);

layer = "pool10";
featuresTrain = activations(net,augimdsTrain,layer,OutputAs="rows");
featuresTest = activations(net,augimdsTest,layer,OutputAs="rows");

훈련 데이터와 테스트 데이터로부터 클래스 레이블을 추출합니다.

TTrain = imdsTrain.Labels;
TTest = imdsTest.Labels;

영상 분류기 피팅하기

훈련 영상으로부터 추출한 특징을 예측 변수로 사용하고 fitcecoc(Statistics and Machine Learning Toolbox)를 사용하여 다중클래스 서포트 벡터 머신(SVM)을 피팅합니다.

mdl = fitcecoc(featuresTrain,TTrain);

테스트 영상 분류하기

훈련된 SVM 모델과 테스트 영상으로부터 추출한 특징을 사용하여 테스트 영상을 분류합니다.

YPred = predict(mdl,featuresTest);

4개의 샘플 테스트 영상을 예측된 레이블과 함께 표시합니다.

idx = [1 5 10 15];
figure
for i = 1:numel(idx)
    subplot(2,2,i)
    I = readimage(imdsTest,idx(i));
    label = YPred(idx(i));
    
    imshow(I)
    title(label)
end

테스트 세트에 대한 분류 정확도를 계산합니다. 정확도는 신경망이 올바르게 예측하는 레이블의 비율입니다.

accuracy = mean(YPred == TTest)
accuracy = 0.9500

이 SVM은 높은 정확도를 갖습니다. 특징 추출을 사용했을 때의 정확도가 충분히 높지 않다면 그 대신 전이 학습을 사용해 보십시오.

입력 인수

모두 축소

훈련된 신경망으로, SeriesNetwork 또는 DAGNetwork 객체로 지정됩니다. 사전 훈련된 신경망을 가져오거나(예: googlenet 함수 사용) trainNetwork를 사용하여 자신만의 고유한 신경망을 훈련시켜 훈련된 신경망을 얻을 수 있습니다.

영상 데이터로, 다음 중 하나로 지정됩니다.

데이터 유형설명대표적인 사용법
데이터저장소ImageDatastore디스크에 저장된 영상의 데이터저장소

디스크에 저장된 같은 크기의 영상들을 사용하여 예측을 수행합니다.

영상 크기가 서로 다른 경우 AugmentedImageDatastore 객체를 사용하십시오.

AugmentedImageDatastore크기 조정, 회전, 반사, 전단, 평행 이동을 비롯한 무작위 아핀 기하 변환을 적용하는 데이터저장소

디스크에 저장된 서로 다른 크기의 영상들을 사용하여 예측을 수행합니다.

TransformedDatastore사용자 지정 변환 함수를 사용하여 기본 데이터저장소에서 읽어 들인 데이터 배치를 변환하는 데이터저장소

  • activations 함수에서 지원하지 않는 출력값을 가진 데이터저장소를 변환합니다.

  • 데이터저장소 출력값에 사용자 지정 변환을 적용합니다.

CombinedDatastore둘 이상의 기본 데이터저장소에서 읽어 들인 데이터저장소

  • 여러 개의 입력값을 갖는 신경망을 사용하여 예측을 수행합니다.

  • 서로 다른 데이터 소스의 예측 변수를 결합합니다.

사용자 지정 미니 배치 데이터저장소데이터의 미니 배치를 반환하는 사용자 지정 데이터저장소

다른 데이터저장소에서 지원하지 않는 형식의 데이터를 사용하여 예측을 수행합니다.

자세한 내용은 Develop Custom Mini-Batch Datastore 항목을 참조하십시오.

숫자형 배열숫자형 배열로 지정된 영상메모리에 맞고 크기 조정과 같은 추가 처리가 필요하지 않은 데이터를 사용하여 예측을 수행합니다.
테이블테이블로 지정된 영상테이블에 저장된 데이터를 사용하여 예측을 수행합니다.

여러 개의 입력값을 갖는 신경망에 데이터저장소를 사용하는 경우, 데이터저장소는 TransformedDatastore 객체이거나 CombinedDatastore 객체여야 합니다.

비디오 데이터와 같은 영상 시퀀스의 경우 sequences 입력 인수를 사용하십시오.

데이터저장소

데이터저장소는 영상 및 응답 변수의 미니 배치를 읽어 들입니다. 데이터저장소는 메모리에 맞지 않는 데이터가 있거나 입력 데이터의 크기를 조정하려는 경우에 사용하십시오.

다음 데이터저장소는 영상 데이터에 대해 activations 함수와 직접 호환됩니다.

딥러닝을 위해 영상을 효율적으로 전처리하려면(영상 크기 조정 포함) augmentedImageDatastore를 사용하십시오. ImageDatastore 객체의 ReadFcn 옵션을 사용하지 마십시오.

ImageDatastore는 프리페치 작업을 사용한 JPG 또는 PNG 영상 파일의 배치 읽기를 허용합니다. ReadFcn 옵션을 사용자 지정 함수로 설정하는 경우, ImageDatastore는 프리페치를 수행하지 않고 일반적으로 상당히 느립니다.

transform 함수와 combine 함수를 사용하여 예측을 수행하기 위해 다른 내장 데이터저장소를 사용할 수 있습니다. 이러한 함수는 데이터저장소에서 읽어 들인 데이터를 classify에 필요한 형식으로 변환할 수 있습니다.

데이터저장소 출력값의 필요한 형식은 신경망 아키텍처에 따라 달라집니다.

신경망 아키텍처데이터저장소 출력값출력값의 예
단일 입력값

테이블 또는 셀형 배열로, 여기서 첫 번째 열은 예측 변수를 지정합니다.

테이블 요소는 스칼라 또는 행 벡터이거나 숫자형 배열을 포함하는 1×1 셀형 배열이어야 합니다.

사용자 지정 데이터저장소는 테이블을 출력해야 합니다.

data = read(ds)
data =

  4×1 table

        Predictors    
    __________________

    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
data = read(ds)
data =

  4×1 cell array

    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
다중 입력값

열 개수가 numInputs개 이상인 셀형 배열로, 여기서 numInputs는 신경망 입력값의 개수입니다.

처음 numInputs개의 열은 각 입력값에 대한 예측 변수를 지정합니다.

입력값의 순서는 신경망의 InputNames 속성으로 지정됩니다.

data = read(ds)
data =

  4×2 cell array

    {224×224×3 double}    {128×128×3 double}
    {224×224×3 double}    {128×128×3 double}
    {224×224×3 double}    {128×128×3 double}
    {224×224×3 double}    {128×128×3 double}

예측 변수의 형식은 데이터의 유형에 따라 달라집니다.

데이터형식
2차원 영상

h×w×c 숫자형 배열로, 여기서 h, w, c는 각각 영상의 높이, 너비, 채널 개수입니다.

3차원 영상h×w×d×c 숫자형 배열로, 여기서 h, w, d, c는 각각 영상의 높이, 너비, 깊이, 채널 개수입니다.

자세한 내용은 Datastores for Deep Learning 항목을 참조하십시오.

숫자형 배열

메모리에 맞고 증대와 같은 추가 처리가 필요하지 않은 데이터의 경우 영상 데이터 세트를 숫자형 배열로 지정할 수 있습니다.

숫자형 배열의 크기와 형태는 영상 데이터의 유형에 따라 달라집니다.

데이터형식
2차원 영상

h×w×c×N 숫자형 배열로, 여기서 h, w, c는 각각 영상의 높이, 너비, 채널 개수이고 N은 영상 개수입니다.

3차원 영상h×w×d×c×N 숫자형 배열로, 여기서 h, w, d, c는 각각 영상의 높이, 너비, 깊이, 채널 개수이고 N은 영상 개수입니다.

테이블

데이터저장소 또는 숫자형 배열의 대안으로 테이블에 영상을 지정할 수도 있습니다.

테이블에 영상을 지정할 때 테이블의 각 행은 관측값 하나에 대응됩니다.

영상 입력의 경우 예측 변수는 다음 중 하나로 지정된 테이블의 첫 번째 열에 있어야 합니다.

  • 영상에 대한 상대 또는 절대 파일 경로로, 문자형 벡터로 지정됩니다.

  • 2차원 영상을 나타내는 h×w×c 숫자형 배열을 포함하는 1×1 셀형 배열로, 여기서 h, w, c는 각각 영상의 높이, 너비, 채널의 개수입니다.

복소수 값 데이터를 신경망에 입력하려면 입력 계층의 SplitComplexInputs 옵션이 1이어야 합니다.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | table
복소수 지원 여부:

시퀀스 또는 시계열 데이터로, 다음 중 하나로 지정됩니다.

데이터 유형설명대표적인 사용법
데이터저장소TransformedDatastore사용자 지정 변환 함수를 사용하여 기본 데이터저장소에서 읽어 들인 데이터 배치를 변환하는 데이터저장소

  • activations 함수에서 지원하지 않는 출력값을 가진 데이터저장소를 변환합니다.

  • 데이터저장소 출력값에 사용자 지정 변환을 적용합니다.

CombinedDatastore둘 이상의 기본 데이터저장소에서 읽어 들인 데이터저장소

  • 여러 개의 입력값을 갖는 신경망을 사용하여 예측을 수행합니다.

  • 서로 다른 데이터 소스의 예측 변수를 결합합니다.

사용자 지정 미니 배치 데이터저장소데이터의 미니 배치를 반환하는 사용자 지정 데이터저장소

다른 데이터저장소에서 지원하지 않는 형식의 데이터를 사용하여 예측을 수행합니다.

자세한 내용은 Develop Custom Mini-Batch Datastore 항목을 참조하십시오.

숫자형 또는 셀형 배열숫자형 배열로 지정된 단일 시퀀스 또는 숫자형 배열로 구성된 셀형 배열로 지정된 시퀀스 데이터 세트메모리에 맞고 사용자 지정 변환과 같은 추가 처리가 필요하지 않은 데이터를 사용하여 예측을 수행합니다.

데이터저장소

데이터저장소는 시퀀스 및 응답 변수의 미니 배치를 읽어 들입니다. 메모리에 맞지 않는 데이터가 있거나 데이터에 변환을 적용하려는 경우에 데이터저장소를 사용하십시오.

다음 데이터저장소는 시퀀스 데이터에 대해 activations 함수와 직접 호환됩니다.

transform 함수와 combine 함수를 사용하여 예측을 수행하기 위해 다른 내장 데이터저장소를 사용할 수 있습니다. 이러한 함수는 데이터저장소에서 읽어 들인 데이터를 activations 함수에 필요한 테이블 또는 셀형 배열 형식으로 변환할 수 있습니다. 예를 들어, 각각 ArrayDatastore 객체 및 TabularTextDatastore 객체를 사용하여 메모리 내 배열 및 CSV 파일에서 읽어 들인 데이터를 변환하고 결합할 수 있습니다.

데이터저장소는 데이터를 테이블 또는 셀형 배열로 반환해야 합니다. 사용자 지정 미니 배치 데이터저장소는 테이블을 출력해야 합니다.

데이터저장소 출력값출력값의 예
테이블
data = read(ds)
data =

  4×2 table

        Predictors    
    __________________

    {12×50 double}
    {12×50 double}
    {12×50 double}
    {12×50 double}
셀형 배열
data = read(ds)
data =

  4×2 cell array

    {12×50 double}
    {12×50 double}
    {12×50 double}
    {12×50 double}

예측 변수의 형식은 데이터의 유형에 따라 달라집니다.

데이터예측 변수의 형식
벡터 시퀀스

c×s 행렬로, 여기서 c는 시퀀스의 특징 개수이고, s는 시퀀스 길이입니다.

1차원 영상 시퀀스

h×c×s 배열로, 여기서 h, c는 각각 영상의 높이와 채널 개수이고, s는 시퀀스 길이입니다.

미니 배치의 각 시퀀스는 시퀀스 길이가 같아야 합니다.

2차원 영상 시퀀스

h×w×c×s 배열로, 여기서 h, w, c는 각각 영상의 높이, 너비, 채널 개수이고, s는 시퀀스 길이입니다.

미니 배치의 각 시퀀스는 시퀀스 길이가 같아야 합니다.

3차원 영상 시퀀스

h×w×d×c×s 배열로, 여기서 h, w, d, c는 각각 영상의 높이, 너비, 깊이, 채널 개수이고, s는 시퀀스 길이입니다.

미니 배치의 각 시퀀스는 시퀀스 길이가 같아야 합니다.

테이블로 반환되는 예측 변수의 경우, 요소는 숫자형 스칼라 또는 숫자형 행 벡터를 포함하거나 숫자형 배열을 포함하는 1×1 셀형 배열을 포함해야 합니다.

자세한 내용은 Datastores for Deep Learning 항목을 참조하십시오.

숫자형 또는 셀형 배열

메모리에 맞고 사용자 지정 변환과 같은 추가 처리가 필요하지 않은 데이터의 경우 단일 시퀀스를 숫자형 배열로 지정하거나 시퀀스 데이터 세트를 숫자형 배열로 구성된 셀형 배열로 지정할 수 있습니다.

셀형 배열 입력값의 경우 셀형 배열은 숫자형 배열로 구성된 N×1 셀형 배열이어야 합니다. 여기서 N은 관측값의 개수입니다. 시퀀스를 나타내는 숫자형 배열의 크기와 형태는 시퀀스 데이터의 유형에 따라 달라집니다.

입력설명
벡터 시퀀스c×s 행렬로, 여기서 c는 시퀀스의 특징 개수이고 s는 시퀀스 길이입니다.
1차원 영상 시퀀스h×c×s 배열로, 여기서 h, c는 각각 영상의 높이, 채널 개수이고 s는 시퀀스 길이입니다.
2차원 영상 시퀀스h×w×c×s 배열로, 여기서 h, w, c는 영상의 높이, 너비, 채널 개수이고 s는 시퀀스 길이입니다.
3차원 영상 시퀀스h×w×d×c×s 배열로, 여기서 h, w, d, c는 3차원 영상의 높이, 너비, 깊이, 채널 개수이고 s는 시퀀스 길이입니다.

복소수 값 데이터를 신경망에 입력하려면 입력 계층의 SplitComplexInputs 옵션이 1이어야 합니다.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | cell
복소수 지원 여부:

특징 데이터로, 다음 중 하나로 지정됩니다.

데이터 유형설명대표적인 사용법
데이터저장소TransformedDatastore사용자 지정 변환 함수를 사용하여 기본 데이터저장소에서 읽어 들인 데이터 배치를 변환하는 데이터저장소

  • activations 함수에서 지원하지 않는 출력값을 가진 데이터저장소를 변환합니다.

  • 데이터저장소 출력값에 사용자 지정 변환을 적용합니다.

CombinedDatastore둘 이상의 기본 데이터저장소에서 읽어 들인 데이터저장소

  • 여러 개의 입력값을 갖는 신경망을 사용하여 예측을 수행합니다.

  • 서로 다른 데이터 소스의 예측 변수를 결합합니다.

사용자 지정 미니 배치 데이터저장소데이터의 미니 배치를 반환하는 사용자 지정 데이터저장소

다른 데이터저장소에서 지원하지 않는 형식의 데이터를 사용하여 예측을 수행합니다.

자세한 내용은 Develop Custom Mini-Batch Datastore 항목을 참조하십시오.

테이블테이블로 지정된 특징 데이터테이블에 저장된 데이터를 사용하여 예측을 수행합니다.
숫자형 배열숫자형 배열로 지정된 특징 데이터메모리에 맞고 사용자 지정 변환과 같은 추가 처리가 필요하지 않은 데이터를 사용하여 예측을 수행합니다.

데이터저장소

데이터저장소는 특징 데이터 및 응답 변수의 미니 배치를 읽어 들입니다. 메모리에 맞지 않는 데이터가 있거나 데이터에 변환을 적용하려는 경우에 데이터저장소를 사용하십시오.

다음 데이터저장소는 특징 데이터에 대해 activations 함수와 직접 호환됩니다.

transform 함수와 combine 함수를 사용하여 예측을 수행하기 위해 다른 내장 데이터저장소를 사용할 수 있습니다. 이러한 함수는 데이터저장소에서 읽어 들인 데이터를 activations 함수에 필요한 테이블 또는 셀형 배열 형식으로 변환할 수 있습니다. 자세한 내용은 Datastores for Deep Learning 항목을 참조하십시오.

여러 개의 입력값을 갖는 신경망의 경우, 데이터저장소는 TransformedDatastore 객체이거나 CombinedDatastore 객체여야 합니다.

데이터저장소는 데이터를 테이블 또는 셀형 배열로 반환해야 합니다. 사용자 지정 미니 배치 데이터저장소는 테이블을 출력해야 합니다. 데이터저장소 출력값의 형식은 신경망 아키텍처에 따라 달라집니다.

신경망 아키텍처데이터저장소 출력값출력값의 예
하나의 입력 계층

하나 이상의 열을 가진 테이블 또는 셀형 배열로, 여기서 첫 번째 열은 예측 변수를 지정합니다.

테이블 요소는 스칼라 또는 행 벡터이거나 숫자형 배열을 포함하는 1×1 셀형 배열이어야 합니다.

사용자 지정 미니 배치 데이터저장소는 테이블을 출력해야 합니다.

1개의 입력값을 갖는 신경망에 대한 테이블입니다.

data = read(ds)
data =

  4×2 table

        Predictors    
    __________________

    {24×1 double}
    {24×1 double}
    {24×1 double}
    {24×1 double}

1개의 입력값을 갖는 신경망에 대한 셀형 배열입니다.

data = read(ds)
data =

  4×1 cell array

    {24×1 double}
    {24×1 double}
    {24×1 double}
    {24×1 double}

여러 개의 입력 계층

열 개수가 numInputs개 이상인 셀형 배열로, 여기서 numInputs는 신경망 입력값의 개수입니다.

처음 numInputs개의 열은 각 입력값에 대한 예측 변수를 지정합니다.

입력값의 순서는 신경망의 InputNames 속성으로 지정됩니다.

2개의 입력값을 갖는 신경망에 대한 셀형 배열입니다.

data = read(ds)
data =

  4×3 cell array

    {24×1 double}    {28×1 double}
    {24×1 double}    {28×1 double}
    {24×1 double}    {28×1 double}
    {24×1 double}    {28×1 double}

예측 변수는 c×1 열 벡터여야 합니다. 여기서 c는 특징의 개수입니다.

자세한 내용은 Datastores for Deep Learning 항목을 참조하십시오.

테이블

메모리에 맞고 사용자 지정 변환과 같은 추가 처리가 필요하지 않은 특징 데이터의 경우 특징 데이터와 응답 변수를 테이블로 지정할 수 있습니다.

테이블의 각 행은 관측값 하나에 대응됩니다. 테이블 열에서 예측 변수의 배치 방식은 작업 유형에 따라 달라집니다.

작업예측 변수
특징 분류

하나 이상의 열에 스칼라로 지정된 특징.

숫자형 배열

메모리에 맞고 사용자 지정 변환과 같은 추가 처리가 필요하지 않은 특성 데이터의 경우 특징 데이터를 숫자형 배열로 지정할 수 있습니다.

숫자형 배열은 N×numFeatures 숫자형 배열이어야 합니다. 여기서 N은 관측값의 개수이고, numFeatures는 입력 데이터의 특징의 개수입니다.

복소수 값 데이터를 신경망에 입력하려면 입력 계층의 SplitComplexInputs 옵션이 1이어야 합니다.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | table
복소수 지원 여부:

여러 개의 입력값을 갖는 신경망에 대한 숫자형 배열 또는 셀형 배열입니다.

영상, 시퀀스, 특징 예측 변수 입력값에 대해 예측 변수 형식은 각각 images, sequences, features 인수 설명에 기술된 형식과 일치해야 합니다.

여러 개의 입력값을 갖는 신경망을 훈련시키는 방법을 보여주는 예제는 영상 데이터와 특징 데이터로 신경망 훈련시키기 항목을 참조하십시오.

복소수 값 데이터를 신경망에 입력하려면 입력 계층의 SplitComplexInputs 옵션이 1이어야 합니다.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | cell
복소수 지원 여부:

혼합된 데이터로, 다음 중 하나로 지정됩니다.

데이터 유형설명대표적인 사용법
TransformedDatastore사용자 지정 변환 함수를 사용하여 기본 데이터저장소에서 읽어 들인 데이터 배치를 변환하는 데이터저장소

  • 여러 개의 입력값을 갖는 신경망을 사용하여 예측을 수행합니다.

  • activations에서 지원하지 않는 데이터저장소의 출력값이 필요한 형식을 갖도록 변환합니다.

  • 데이터저장소 출력값에 사용자 지정 변환을 적용합니다.

CombinedDatastore둘 이상의 기본 데이터저장소에서 읽어 들인 데이터저장소

  • 여러 개의 입력값을 갖는 신경망을 사용하여 예측을 수행합니다.

  • 서로 다른 데이터 소스의 예측 변수를 결합합니다.

사용자 지정 미니 배치 데이터저장소데이터의 미니 배치를 반환하는 사용자 지정 데이터저장소

다른 데이터저장소에서 지원하지 않는 형식의 데이터를 사용하여 예측을 수행합니다.

자세한 내용은 Develop Custom Mini-Batch Datastore 항목을 참조하십시오.

transform 함수와 combine 함수를 사용하여 예측을 수행하기 위해 다른 내장 데이터저장소를 사용할 수 있습니다. 이러한 함수는 데이터저장소에서 읽어 들인 데이터를 activations 함수에 필요한 테이블 또는 셀형 배열 형식으로 변환할 수 있습니다. 자세한 내용은 Datastores for Deep Learning 항목을 참조하십시오.

데이터저장소는 데이터를 테이블 또는 셀형 배열로 반환해야 합니다. 사용자 지정 미니 배치 데이터저장소는 테이블을 출력해야 합니다. 데이터저장소 출력값의 형식은 신경망 아키텍처에 따라 달라집니다.

데이터저장소 출력값출력값의 예

열의 개수가 numInputs인 셀형 배열로, 여기서 numInputs는 신경망 입력값의 개수입니다.

입력값의 순서는 신경망의 InputNames 속성으로 지정됩니다.

data = read(ds)
data =

  4×3 cell array

    {24×1 double}    {28×1 double}
    {24×1 double}    {28×1 double}
    {24×1 double}    {28×1 double}
    {24×1 double}    {28×1 double}

영상, 시퀀스, 특징 예측 변수 입력값에 대해 예측 변수 형식은 각각 images, sequences, features 인수 설명에 기술된 형식과 일치해야 합니다.

여러 개의 입력값을 갖는 신경망을 훈련시키는 방법을 보여주는 예제는 영상 데이터와 특징 데이터로 신경망 훈련시키기 항목을 참조하십시오.

숫자형 배열을 데이터저장소로 변환하려면 arrayDatastore를 사용하십시오.

활성화 결과를 추출할 계층으로, 숫자형 인덱스 또는 문자형 벡터로 지정됩니다.

SeriesNetwork 객체의 활성화 결과를 구하려면 layer를 숫자형 인덱스로 지정하거나 계층 이름에 해당하는 문자형 벡터로 지정하십시오.

DAGNetwork 객체의 활성화 결과를 구하려면 layer를 계층 이름에 해당하는 문자형 벡터로 지정하십시오. 계층에 여러 개의 출력값이 있다면 계층 이름을 지정하고, 문자 “/”를 입력하고, 이어서 계층 출력값의 이름을 지정하여 계층과 출력값을 지정합니다. 즉, layer'layerName/outputName'과 같은 형식으로 지정합니다.

예: 3

예: 'conv1'

예: 'mpool/out'

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: MiniBatchSize=256은 미니 배치 크기를 256으로 지정합니다.

활성화 결과 출력 형식으로, "channels", "rows" 또는 "columns"로 지정됩니다. 출력 형식에 대한 설명은 act 항목을 참조하십시오.

영상 입력값의 경우, OutputAs 옵션이 "channels"이면 입력 데이터의 영상은 신경망의 영상 입력 계층의 입력 크기보다 클 수 있습니다. 그 밖의 다른 출력 형식의 경우에는 입력값의 영상 크기가 신경망의 영상 입력 계층의 입력 크기와 같아야 합니다.

예측에 사용할 미니 배치의 크기로, 양의 정수로 지정됩니다. 미니 배치가 클수록 메모리가 더 많이 필요하지만 예측 속도는 빨라질 수 있습니다.

입력 시퀀스를 채우거나 자르거나 분할하는 옵션으로, 다음 중 하나로 지정됩니다.

  • "longest" — 각 미니 배치의 시퀀스 길이가 가장 긴 시퀀스의 길이와 같아지도록 채웁니다. 이 옵션은 채우기로 인해 신경망에 잡음이 포함되더라도 데이터를 버리지 않습니다.

  • "shortest" — 각 미니 배치의 시퀀스가 가장 짧은 시퀀스와 길이가 같아지도록 자릅니다. 이 옵션은 데이터를 버리게 되더라도 채우기를 추가하지 않습니다.

  • 양의 정수 — 각 미니 배치에 대해, 미니 배치에서 가장 긴 시퀀스의 길이에 맞춰 시퀀스를 채운 다음, 지정된 길이를 갖는 더 작은 크기의 시퀀스로 분할합니다. 분할이 이루어지면 소프트웨어가 미니 배치를 추가로 만듭니다. 데이터의 시퀀스 길이가 지정된 시퀀스 길이로 균등하게 나뉘지 않는 경우, 해당 시퀀스의 끝을 포함하는 미니 배치의 길이는 지정된 시퀀스 길이보다 짧습니다. 전체 시퀀스가 메모리에 맞지 않으면 이 옵션을 사용하십시오. 또는 MiniBatchSize 옵션을 더 낮은 값으로 설정하여 미니 배치당 시퀀스 개수를 줄여 보십시오.

입력 시퀀스 채우기, 자르기, 분할의 효과에 대한 자세한 정보는 시퀀스 채우기, 자르기 및 분할 항목을 참조하십시오.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | char | string

입력 시퀀스에 채울 값으로, 스칼라로 지정됩니다.

시퀀스를 NaN으로 채우면 신경망 전체로 오류가 전파될 수 있으므로 유의하십시오.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

채우기 또는 자르기 방향으로, 다음 중 하나로 지정됩니다.

  • "right" — 시퀀스들을 오른쪽에서 채우거나 자릅니다. 시퀀스들은 동일한 시간 스텝에서 시작하며 소프트웨어가 시퀀스들의 끝부분에서 자르기나 채우기를 수행합니다.

  • "left" — 시퀀스들을 왼쪽에서 채우거나 자릅니다. 시퀀스들이 동일한 시간 스텝에서 끝나도록 소프트웨어가 시퀀스들의 시작 부분에서 자르기나 채우기를 수행합니다.

순환 계층은 시퀀스 데이터를 한 번에 하나의 시간 스텝씩 처리하기 때문에 순환 계층의 OutputMode 속성이 "last"인 경우 마지막 시간 스텝에서의 채우기가 계층 출력에 부정적인 영향을 줄 수 있습니다. 시퀀스 데이터를 왼쪽에서 채우거나 자르려면 SequencePaddingDirection 옵션을 "left"로 설정하십시오.

sequence-to-sequence 신경망의 경우(각 순환 계층의 OutputMode 속성이 "sequence"인 경우), 첫 시간 스텝들에서의 채우기가 앞쪽에 있는 시간 스텝들의 예측에 부정적인 영향을 줄 수 있습니다. 시퀀스 데이터를 오른쪽에서 채우거나 자르려면 SequencePaddingDirection 옵션을 "right"로 설정하십시오.

입력 시퀀스 채우기, 자르기, 분할의 효과에 대한 자세한 정보는 시퀀스 채우기, 자르기 및 분할 항목을 참조하십시오.

성능 최적화로, 다음 중 하나로 지정됩니다.

  • "auto" — 입력 신경망 및 하드웨어 리소스에 적합한 여러 최적화를 자동으로 적용합니다.

  • "mex" — MEX 함수를 컴파일하고 실행합니다. 이 옵션은 GPU를 사용하는 경우에만 사용할 수 있습니다. GPU를 사용하려면 Parallel Computing Toolbox 라이선스와 지원되는 GPU 장치가 필요합니다. 지원되는 장치에 대한 자세한 내용은 GPU 연산 요구 사항 (Parallel Computing Toolbox) 항목을 참조하십시오. Parallel Computing Toolbox 또는 적당한 GPU를 사용할 수 없는 경우, 오류가 반환됩니다.

  • "none" — 모든 가속을 비활성화합니다.

Acceleration"auto"인 경우 MATLAB®은 호환되는 여러 최적화를 적용하고 MEX 함수를 생성하지 않습니다.

"auto""mex" 옵션을 사용하면 초기 실행 시간이 늘어나는 대신 성능이 향상될 수 있습니다. 호환되는 파라미터를 사용한 후속 호출은 더 빨리 실행됩니다. 성능 최적화는 새 입력 데이터를 사용하여 함수를 여러 번 호출해야 하는 경우에 사용하십시오.

"mex" 옵션은 신경망과 함수 호출에서 사용된 파라미터에 따라 MEX 함수를 생성하고 실행합니다. 단일 신경망에 한 번에 여러 개의 MEX 함수가 연결되어 있을 수 있습니다. 신경망 변수를 지우면 해당 신경망에 연결된 모든 MEX 함수도 지워집니다.

"mex" 옵션은 sequenceInputLayer 객체를 제외하고 Supported Layers (GPU Coder) 페이지에 나열된 계층을 포함하는 신경망을 지원합니다.

"mex" 옵션은 단일 GPU를 사용하는 경우에 사용할 수 있습니다.

"mex" 옵션을 사용하려면 C/C++ 컴파일러가 설치되어 있어야 하며 GPU Coder™ Interface for Deep Learning 지원 패키지가 필요합니다. MATLAB의 애드온 탐색기를 사용하여 지원 패키지를 설치하십시오. 설정 지침은 MEX Setup (GPU Coder) 항목을 참조하십시오. GPU Coder는 필요하지 않습니다.

양자화된 신경망의 경우, "mex" 옵션을 사용하려면 Compute Capability 6.1, 6.3 또는 그 이상을 갖춘 CUDA® 지원 NVIDIA® GPU가 필요합니다.

"mex" 옵션을 사용할 경우 MATLAB Compiler™는 신경망 배포를 지원하지 않습니다.

하드웨어 리소스로, 다음 중 하나로 지정됩니다.

  • "auto" — GPU를 사용할 수 있으면 GPU를 사용하고 그렇지 않으면 CPU를 사용합니다.

  • "gpu" — GPU를 사용합니다. GPU를 사용하려면 Parallel Computing Toolbox 라이선스와 지원되는 GPU 장치가 필요합니다. 지원되는 장치에 대한 자세한 내용은 GPU 연산 요구 사항 (Parallel Computing Toolbox) 항목을 참조하십시오. Parallel Computing Toolbox 또는 적당한 GPU를 사용할 수 없는 경우, 오류가 반환됩니다.

  • "cpu" — CPU를 사용합니다.

  • "multi-gpu" — 디폴트 클러스터 프로파일에 따라 로컬 병렬 풀을 사용하여 컴퓨터 1대에서 여러 개의 GPU를 사용합니다. 기존 병렬 풀이 없는 경우 소프트웨어는 사용 가능한 GPU의 개수와 동일한 풀 크기로 병렬 풀을 시작합니다.

  • "parallel" — 디폴트 클러스터 프로파일에 따라 로컬 또는 원격 병렬 풀을 사용합니다. 기존 병렬 풀이 없는 경우 소프트웨어는 디폴트 클러스터 프로파일을 사용하여 병렬 풀을 시작합니다. 풀이 GPU를 사용할 수 있는 경우, 고유한 GPU를 갖는 워커만 계산을 수행합니다. 풀에 GPU가 없는 경우, 대신 사용 가능한 모든 CPU 워커에서 계산이 이루어집니다.

서로 다른 실행 환경을 사용해야 하는 경우에 대한 자세한 내용은 Scale Up Deep Learning in Parallel, on GPUs, and in the Cloud 항목을 참조하십시오.

"gpu", "multi-gpu", "parallel" 옵션을 사용하려면 Parallel Computing Toolbox가 필요합니다. 딥러닝을 위해 GPU를 사용하려면 지원되는 GPU 장치도 필요합니다. 지원되는 장치에 대한 자세한 내용은 GPU 연산 요구 사항 (Parallel Computing Toolbox) 항목을 참조하십시오. 이러한 옵션 중 하나를 선택했는데 Parallel Computing Toolbox 또는 적당한 GPU가 없는 경우, 오류가 반환됩니다.

ExecutionEnvironment"multi-gpu" 또는 "parallel"로 설정하여 순환 계층이 있는 신경망으로 병렬로 예측을 수행하려면, SequenceLength 옵션은 "shortest" 또는 "longest"여야 합니다.

State 파라미터를 포함하는 사용자 지정 계층이 있는 신경망은 병렬 예측 수행을 지원하지 않습니다.

출력 인수

모두 축소

신경망 계층의 활성화 결과로, 숫자형 배열 또는 숫자형 배열로 구성된 셀형 배열로 반환됩니다. act의 형식은 입력 데이터의 유형, 계층 출력값의 유형 및 지정된 OutputAs 옵션에 따라 달라집니다.

영상 출력값 또는 접힌 시퀀스 출력값

계층이 영상 또는 접힌 시퀀스 데이터를 출력하는 경우 act는 숫자형 배열입니다.

OutputAsact
"channels"

2차원 영상 출력값에 대해, act는 h×w×c×n 배열입니다. 여기서 h, w, c는 선택한 계층 출력값의 높이, 너비, 채널 개수이고, n은 영상 개수입니다. 이 경우 act(:,:,:,i)i번째 영상에 대한 활성화 결과를 포함합니다.

3차원 영상 출력값에 대해, act는 h×w×d×c×n 배열입니다. 여기서 h, w, d, c는 각각 선택한 계층 출력값의 높이, 너비, 깊이, 채널 개수이고, n은 영상 개수입니다. 이 경우 act(:,:,:,:,i)i번째 영상에 대한 활성화 결과를 포함합니다.

접힌 2차원 영상 시퀀스 출력값에 대해, act는 h×w×c×(n*s) 배열입니다. 여기서 h, w, c는 각각 선택한 계층 출력값의 높이, 너비, 채널 개수이고, n은 시퀀스 개수이고, s는 시퀀스 길이입니다. 이 경우 act(:,:,:,(t-1)*n+k)k번째 시퀀스의 시간 스텝 t에 대한 활성화 결과를 포함합니다.

접힌 3차원 영상 시퀀스 출력값에 대해, act는 h×w×d×c×(n*s) 배열입니다. 여기서 h, w, d, c는 각각 선택한 계층 출력값의 높이, 너비, 깊이, 채널 개수이고, n은 시퀀스 개수이고, s는 시퀀스 길이입니다. 이 경우 act(:,:,:,:,(t-1)*n+k)k번째 시퀀스의 시간 스텝 t에 대한 활성화 결과를 포함합니다.

"rows"

2차원 및 3차원 영상 출력값에 대해, act는 n×m 행렬입니다. 여기서 n은 영상의 개수이고, m은 계층의 출력값 요소 개수입니다. 이 경우 act(i,:)i번째 영상에 대한 활성화 결과를 포함합니다.

접힌 2차원 및 3차원 영상 시퀀스 출력값에 대해, act는 (n*s)×m 행렬입니다. 여기서 n은 시퀀스 개수이고, s는 시퀀스 길이이고, m은 계층의 출력값 요소 개수입니다. 이 경우 act((t-1)*n+k,:)k번째 시퀀스의 시간 스텝 t에 대한 활성화 결과를 포함합니다.

"columns"

2차원 및 3차원 영상 출력값에 대해, act는 m×n 행렬입니다. 여기서 m은 선택한 계층의 출력값 요소 개수이고, n은 영상의 개수입니다. 이 경우 act(:,i)i번째 영상에 대한 활성화 결과를 포함합니다.

접힌 2차원 및 3차원 영상 시퀀스 출력값에 대해, act는 m×(n*s) 행렬입니다. 여기서 m은 선택한 계층의 출력값 요소 개수이고, n은 시퀀스 개수이고, s는 시퀀스 길이입니다. 이 경우 act(:,(t-1)*n+k)k번째 시퀀스의 시간 스텝 t에 대한 활성화 결과를 포함합니다.

시퀀스 출력값

layer에 시퀀스 출력값이 있는 경우(예: 출력 모드가 "sequence"인 LSTM 계층), act는 셀형 배열입니다. 이 경우 "OutputAs" 옵션은 "channels"여야 합니다.

OutputAsact
"channels"

벡터 시퀀스 출력에 대해, act는 c×s 행렬로 구성된 n×1 셀형 배열입니다. 여기서 n은 시퀀스 개수이고, c는 시퀀스에 있는 특징의 개수이고, s는 시퀀스 길이입니다.

2차원 영상 시퀀스 출력에 대해, act는 h×w×c×s 행렬로 구성된 n×1 셀형 배열입니다. 여기서 n은 시퀀스 개수이고, h, w, c는 각각 영상의 높이, 너비, 채널 개수이고, s는 시퀀스 길이입니다.

3차원 영상 시퀀스 출력에 대해, act는 h×w×c×d×s 행렬로 구성된 n×1 셀형 배열입니다. 여기서 n은 시퀀스 개수이고, h, w, d, c는 각각 영상의 높이, 너비, 깊이, 채널 개수이고, s는 시퀀스 길이입니다.

위의 경우 act{i}i번째 시퀀스에 대한 활성화 결과를 포함합니다.

특징 벡터 및 단일 시간 스텝 출력값

layer가 특징 벡터 또는 시퀀스의 단일 시간 스텝을 출력하는 경우(예: 출력 모드가 "last"인 LSTM 계층), act는 숫자형 배열입니다.

OutputAsact
"channels"

특징 벡터 또는 벡터 데이터를 포함하는 단일 시간 스텝에 대해, act는 c×n 행렬입니다. 여기서 n은 관측값 개수이고, c는 특징의 개수입니다.

2차원 영상 데이터를 포함하는 단일 시간 스텝에 대해, act는 h×w×c×n 배열입니다. 여기서 n은 시퀀스 개수이고, h, w, c는 각각 영상의 높이, 너비, 채널 개수입니다.

3차원 영상 데이터를 포함하는 단일 시간 스텝에 대해, act는 h×w×c×d×n 배열입니다. 여기서 n은 시퀀스 개수이고, h, w, d, c는 각각 영상의 높이, 너비, 깊이, 채널 개수입니다.

"rows"n×m 행렬로, 여기서 n은 관측값의 개수이고 m은 선택한 계층의 출력값 요소 개수입니다. 이 경우 act(i,:)i번째 시퀀스에 대한 활성화 결과를 포함합니다.
"columns"m×n 행렬로, 여기서 m은 선택한 계층의 출력값 요소 개수이고 n은 관측값의 개수입니다. 이 경우 act(:,i)i번째 영상에 대한 활성화 결과를 포함합니다.

알고리즘

모두 축소

부동소수점 연산방식

trainnet 또는 trainNetwork 함수를 사용하여 신경망을 훈련시키거나 DAGNetwork 객체 및 SeriesNetwork 객체와 함께 예측 함수 또는 검증 함수를 사용할 때 소프트웨어는 단정밀도 부동소수점 연산방식을 사용하여 이러한 계산을 수행합니다. 예측 및 검증을 위한 함수는 predict, classify, activations 등이 있습니다. CPU와 GPU를 모두 사용하여 신경망을 훈련시키는 경우, 단정밀도 연산방식이 사용됩니다.

재현성

최상의 성능을 위해 MATLAB에서 GPU를 사용해 딥러닝을 실행한다고 해도 성능이 반드시 보장되는 것은 아닙니다. 신경망 아키텍처에 따라 GPU를 사용하여 두 개의 같은 신경망을 훈련시키거나 동일한 신경망 및 데이터를 사용하여 두 개의 예측값을 생성할 때 조건에 따라 결과가 달라질 수 있습니다.

확장 기능

버전 내역

R2016a에 개발됨

모두 확장