이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.
이 페이지에는 MATLAB®에서 제공하는 딥러닝 계층의 목록이 정리되어 있습니다.
다양한 작업을 위해 계층에서 신경망을 만드는 방법을 알아보려면 다음 예제를 참조하십시오.
작업 | 자세히 알아보기 |
---|---|
영상 분류 또는 회귀를 위한 딥러닝 신경망 만들기. | |
시퀀스 및 시계열 데이터를 위한 딥러닝 신경망 만들기 | |
오디오 데이터를 위한 딥러닝 신경망 만들기. | 딥러닝을 사용해 음성 명령 인식하기 |
텍스트 데이터를 위한 딥러닝 신경망 만들기. |
다음 함수를 사용하여 다양한 계층 유형을 만들 수 있습니다. 또는 심층 신경망 디자이너 앱을 사용하여 대화형 방식으로 신경망을 만들 수 있습니다.
사용자 지정 계층을 정의하는 방법은 사용자 지정 딥러닝 계층 정의하기 항목을 참조하십시오.
계층 | 설명 |
---|---|
영상 입력 계층은 신경망에 2차원 영상을 입력하고 데이터 정규화를 적용합니다. | |
3차원 영상 입력 계층은 신경망에 3차원 영상 또는 3차원 볼륨을 입력하고 데이터 정규화를 적용합니다. | |
시퀀스 입력 계층은 신경망에 시퀀스 데이터를 입력합니다. | |
| ROI 입력 계층은 Fast R-CNN 객체 검출 신경망에 영상을 입력합니다. |
계층 | 설명 |
---|---|
2차원 컨벌루션 계층은 입력값에 슬라이딩 컨벌루션 필터를 적용합니다. | |
3차원 컨벌루션 계층은 3차원 입력값에 직육면체의 슬라이딩 컨벌루션 필터를 적용합니다. | |
2차원 그룹 컨벌루션 계층은 입력 채널을 여러 그룹으로 분리해서 슬라이딩 컨벌루션 필터를 적용합니다. 그룹 컨벌루션 계층은 채널별로 분리 가능한(심도별로 분리 가능하다고 하기도 함) 컨벌루션에 사용하십시오. | |
전치 2차원 컨벌루션 계층은 특징 맵을 업샘플링합니다. | |
전치 3차원 컨벌루션 계층은 3차원 특징 맵을 업샘플링합니다. | |
완전 연결 계층은 입력값에 가중치 행렬을 곱한 다음 편향 벡터를 더합니다. |
계층 | 설명 |
---|---|
시퀀스 입력 계층은 신경망에 시퀀스 데이터를 입력합니다. | |
LSTM 계층은 시계열 및 시퀀스 데이터에서 시간 스텝 간의 장기 종속성을 학습합니다. | |
BiLSTM(양방향 장단기 기억) 계층은 시계열 또는 시퀀스 데이터의 시간 스텝 간의 양방향 장기 종속성을 학습합니다. 이러한 종속성은 신경망이 각 시간 스텝에서 전체 시계열로부터 학습하도록 하려는 경우에 유용할 수 있습니다. | |
GRU 계층은 시계열 및 시퀀스 데이터에서 시간 스텝 간의 종속성을 학습합니다. | |
시퀀스 접기 계층은 영상 시퀀스 배치를 영상 배치로 변환합니다. 영상 시퀀스의 시간 스텝에 대해 독립적으로 컨벌루션 연산을 수행하려는 경우 시퀀스 접기 계층을 사용하십시오. | |
시퀀스 펼치기 계층은 시퀀스 접기 후에 입력 데이터의 시퀀스 구조를 복원합니다. | |
평탄화 계층은 입력값의 공간 차원을 채널 차원으로 축소합니다. | |
| 단어 임베딩 계층은 단어 인덱스를 벡터로 매핑합니다. |
계층 | 설명 |
---|---|
ReLU 계층은 입력값의 각 요소에 대해 0보다 작은 값은 모두 0으로 설정하는 임계값 연산을 수행합니다. | |
Leaky ReLU 계층은 0보다 작은 모든 입력값에 고정된 스칼라를 곱하는 임계값 연산을 수행합니다. | |
Clipped ReLU 계층은 0보다 작은 입력값은 모두 0으로 설정하고 자르기 상한(clipping ceiling)보다 큰 값은 모두 자르기 상한값으로 설정하는 임계값 연산을 수행합니다. | |
ELU 활성화 계층은 양의 입력값에 항등 연산을 수행하고 음의 입력값에 비선형 지수 연산을 수행합니다. | |
쌍곡탄젠트(tanh) 활성화 계층은 계층 입력값에 tanh 함수를 적용합니다. | |
| PReLU 계층은 각 채널마다 0보다 작은 입력값을 훈련 시점에 학습한 스칼라로 곱하는 임계값 연산을 수행합니다. |
계층 | 설명 |
---|---|
배치 정규화 계층은 미니 배치에서 각 입력 채널을 정규화합니다. 컨벌루션 신경망의 훈련 속도를 높이고 신경망 초기화에 대한 민감도를 줄이려면 컨벌루션 계층과 비선형 계층(예: ReLU 계층) 사이에 배치 정규화 계층을 추가하십시오. | |
채널별 국소 응답(교차 채널) 정규화 계층은 채널별 정규화를 수행합니다. | |
드롭아웃 계층은 주어진 확률에 따라 입력 요소를 무작위로 0으로 설정합니다. | |
2차원 자르기 계층은 입력값에 2차원 자르기를 적용합니다. | |
3차원 자르기 계층은 3차원 볼륨을 입력 특징 맵의 크기로 자릅니다. |
계층 | 설명 |
---|---|
평균값 풀링 계층은 입력값을 직사각형 풀링 영역으로 나누고 각 영역의 평균 값을 계산하여 다운샘플링을 수행합니다. | |
3차원 평균값 풀링 계층은 3차원 입력값을 직육면체 풀링 영역으로 나누고 각 영역의 평균 값을 계산하여 다운샘플링을 수행합니다. | |
전역 평균값 풀링 계층은 입력값의 높이 및 너비 차원의 평균을 계산하여 다운샘플링을 수행합니다. | |
3차원 전역 평균값 풀링 계층은 입력값의 높이, 너비, 깊이 차원의 평균을 계산하여 다운샘플링을 수행합니다. | |
최댓값 풀링 계층은 입력값을 직사각형 풀링 영역으로 나누고 각 영역의 최댓값을 계산하여 다운샘플링을 수행합니다. | |
3차원 최댓값 풀링 계층은 3차원 입력값을 직육면체 풀링 영역으로 나누고 각 영역의 최댓값을 계산하여 다운샘플링을 수행합니다. | |
전역 최댓값 풀링 계층은 입력값의 높이 및 너비 차원의 최댓값을 계산하여 다운샘플링을 수행합니다. | |
3차원 전역 최댓값 풀링 계층은 입력값의 높이, 너비, 깊이 차원의 최댓값을 계산하여 다운샘플링을 수행합니다. | |
최댓값 언풀링 계층은 최댓값 풀링 계층의 출력값을 언풀링합니다. |
계층 | 설명 |
---|---|
덧셈 계층은 여러 신경망 계층의 입력값을 요소별로 더합니다. | |
심도 결합 계층은 동일한 높이와 너비를 갖는 입력값을 받아서 세 번째 차원(채널 차원)을 따라 결합합니다. | |
결합 계층은 입력값을 받아서 지정된 차원을 따라 결합합니다. 입력값은 결합 차원을 제외한 모든 차원에서 크기가 동일해야 합니다. | |
| 가중 덧셈 계층은 여러 신경망 계층의 입력값을 요소별로 스케일링하고 더합니다. |
계층 | 설명 |
---|---|
| ROI 입력 계층은 Fast R-CNN 객체 검출 신경망에 영상을 입력합니다. |
| ROI 최댓값 풀링 계층은 입력 특징 맵에 있는 모든 직사각형 ROI에 대해 고정된 크기의 특징 맵을 출력합니다. Fast R-CNN 또는 Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
| 앵커 상자 계층은 객체 검출 신경망에서 사용되는 특징 맵의 앵커 상자를 저장합니다. |
| 영역 제안 계층은 Faster R-CNN의 영역 제안 신경망(RPN)에 속하며, 영상에서 사물일 가능성이 있는 부분을 둘러싸는 경계 상자를 출력합니다. |
| SSD 병합 계층은 후속 회귀 및 분류 손실 계산을 위해 특징 맵의 출력값을 병합합니다. |
| 영역 제안 신경망(RPN) 소프트맥스 계층은 입력값에 소프트맥스 활성화 함수를 적용합니다. Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
| 중점 손실 계층은 중점 손실(focal loss)을 사용하여 객체 클래스를 예측합니다. |
| 영역 제안 신경망(RPN) 분류 계층은 교차 엔트로피 손실 함수를 사용하여 영상 영역을 사물 또는 배경으로 분류합니다. Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
| 상자 회귀 계층은 smooth-L1 손실 함수를 사용하여 경계 상자 위치를 미세 조정합니다. Fast R-CNN 또는 Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
계층 | 설명 |
---|---|
| 사영 및 형태 변경 계층은 1x1xnumLatentInputs 배열을 입력값으로 받은 후 지정된 크기의 영상으로 변환합니다. 잡음 입력값을 GAN으로 형태 변경하려면 사영 및 형태 변경 계층을 사용하십시오. |
| 임베드 및 형태 변경 계층은 범주형 요소의 숫자형 인덱스를 입력값으로 받은 후 지정된 크기의 영상으로 변환합니다. 조건부 GAN에 범주형 데이터를 입력하려면 임베드 및 형태 변경 계층을 사용하십시오. |
계층 | 설명 |
---|---|
소프트맥스 계층은 입력값에 소프트맥스 함수를 적용합니다. | |
분류 계층은 상호 배타적인 클래스를 갖는 다중 클래스 분류 문제에 대해 교차 엔트로피 손실을 계산합니다. | |
회귀 계층은 회귀 문제의 손실을 평균 제곱 오차의 절반을 취한 값으로 계산합니다. | |
| 픽셀 분류 계층은 각 영상 픽셀 또는 복셀에 categorical형 레이블을 제공합니다. |
| 다이스 픽셀 분류 계층은 일반화된 다이스 손실을 사용하여 각 영상 픽셀 또는 복셀에 categorical형 레이블을 제공합니다. |
| 중점 손실 계층은 중점 손실(focal loss)을 사용하여 객체 클래스를 예측합니다. |
| 영역 제안 신경망(RPN) 소프트맥스 계층은 입력값에 소프트맥스 활성화 함수를 적용합니다. Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
| 영역 제안 신경망(RPN) 분류 계층은 교차 엔트로피 손실 함수를 사용하여 영상 영역을 사물 또는 배경으로 분류합니다. Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
| 상자 회귀 계층은 smooth-L1 손실 함수를 사용하여 경계 상자 위치를 미세 조정합니다. Fast R-CNN 또는 Faster R-CNN 객체 검출 신경망을 만들려면 이 계층을 사용하십시오. |
| 가중 분류 계층은 분류 문제에 대해 가중 교차 엔트로피 손실을 계산합니다. |
| Tversky 픽셀 분류 계층은 Tversky 손실을 사용하여 각 영상 픽셀 또는 복셀에 categorical형 레이블을 제공합니다. |
| 분류 SSE 계층은 분류 문제의 손실을 오차 제곱합으로 계산합니다. |
| 회귀 MAE 계층은 회귀 문제의 손실을 평균 절대 오차로 계산합니다. |
trainingOptions
| trainNetwork
| 심층 신경망 디자이너