dljacobian

야코비 행렬 딥러닝 연산

R2024b 이후

페이지 내 모두 축소

구문

jac = dljacobian(u,x,dim)

jac = dljacobian(u,x,dim,EnableHigherDerivatives=tf)

설명

야코비 행렬 딥러닝 연산은 지정된 입력 데이터와 연산 차원에 대해 신경망 및 모델 함수 출력값의 야코비 행렬을 반환합니다.

jac = dljacobian(u,x,dim)은 지정된 연산 차원에 대해 데이터 x에 대한 신경망 또는 모델 함수 출력값 u의 야코비 행렬을 반환합니다.

예제

jac = dljacobian(u,x,dim,EnableHigherDerivatives=tf)는 역방향 통과(backward pass)를 추적하여 고계 도함수를 활성화할지 여부도 지정합니다.

예제

모두 축소

딥러닝 데이터의 야코비 행렬 계산하기

라이브 스크립트 열기

신경망을 만듭니다.

inputSize = [16 16 3];
numOutputChannels = 5;

layers = [
    imageInputLayer(inputSize)
    convolution2dLayer(3,64)
    reluLayer
    fullyConnectedLayer(numOutputChannels)
    softmaxLayer];

net = dlnetwork(layers);

훈련 데이터를 불러옵니다. 이 예제의 목적에 맞게, 임의의 데이터를 생성합니다.

numObservations = 128;
X = rand([inputSize numObservations]);
X = dlarray(X,"SSCB");

T = rand([numOutputChannels numObservations]);
T = dlarray(T,"CB");

신경망과 데이터를 입력값으로 받고 손실, 학습 가능한 파라미터에 대한 손실의 기울기, 입력 데이터에 대한 예측값의 야코비 행렬을 반환하는 모델 손실 함수를 정의합니다.

function [loss,gradients,jac] = modelLoss(net,X,T)

Y = forward(net,X);
loss = l1loss(Y,T);

X = stripdims(X);
Y = stripdims(Y);

jac = dljacobian(Y,X,1);
gradients = dlgradient(loss,net.Learnables);

end

dlfeval 함수를 사용하여 모델 손실 함수를 평가합니다.

[loss,gradients,jac] = dlfeval(@modelLoss,net,X,T);

야코비 행렬의 크기를 확인합니다.

size(jac)

ans = 1×5

     5    16    16     3   128

입력 인수

모두 축소

`u` — 신경망 또는 모델 함수 출력값
추적되는 `dlarray` 행렬

신경망 또는 모델 함수 출력값으로, 추적되는 dlarray 행렬로 지정됩니다.

추적되는 dlarray 객체는 자동 미분 맥락에서 연산이 수행되는 dlarray 객체입니다. 자동 미분이 활성화된 함수를 평가할 때, 관련 연산이 추적이라는 데이터 구조에 기록되며 이 추적을 사용하여 도함수가 계산됩니다. dlarray가 추적되는 상황은 다음과 같습니다.

trainnet 함수가 평가하는 손실 함수 내부
사용자 지정 계층에서 평가하는 순방향 함수 내부
dlfeval 함수가 평가하는 모델 함수와 모델 손실 함수 내부

dim 인수로 지정되지 않은 차원의 크기는 일치해야 합니다.

`x` — 입력 데이터
추적되는 `dlarray` 객체

입력 데이터로, 추적되는 dlarray 객체로 지정됩니다.

trainnet 함수가 평가하는 손실 함수 내부
사용자 지정 계층에서 평가하는 순방향 함수 내부
dlfeval 함수가 평가하는 모델 함수와 모델 손실 함수 내부

dim 인수로 지정되지 않은 차원의 크기는 일치해야 합니다.

`dim` — 연산 차원
양의 정수

u의 연산 차원으로, 양의 정수로 지정됩니다.

dljacobian 함수는 데이터의 나머지 차원을 독립된 배치 차원으로 처리합니다.

`tf` — 고계 도함수를 활성화할지 지정하는 플래그
`true` 또는 `1` (디폴트 값) | `false` 또는 `0`

고계 도함수를 활성화할지 지정하는 플래그로, 다음 값 중 하나로 지정됩니다.

숫자형 또는 논리값 1(true) — 고계 도함수를 활성화합니다. 자동 미분을 사용하여 도함수를 계산하는 함수(예: dlgradient, dljacobian, dldivergence, dllaplacian)를 이후에 호출할 때 여기서 반환된 값을 추가 계산에 사용할 수 있도록, 역방향 통과를 추적합니다.
숫자형 또는 논리값 0(false) — 고계 도함수를 비활성화합니다. 역방향 통과를 추적하지 않습니다. 1계 도함수만 계산하려는 경우 이 옵션이 대체로 속도가 빠르고 필요한 메모리가 더 적습니다.

출력 인수

모두 축소

`jac` — 야코비 행렬
형식이 지정되지 않은 `dlarray` 객체

야코비 행렬로, 형식이 지정되지 않은 dlarray 객체로 반환됩니다.

jac의 레이아웃은 dim과, u 및 x의 크기에 따라 달라집니다.

출력 jac는 (N+1)차원 배열이고, 여기서 N은 x의 차원 수입니다. 출력 jac의 크기는 [szU,szX1,szX2,...,szXN]이고, 여기서 szU는 size(u,dim)에 해당하며 [szX1,szX2,...,szXN]은 x의 크기입니다.

다음과 같이 jac의 각 요소는 x의 요소에 대한 u의 요소의 편도함수를 나타냅니다.

dim이 1이면, jac(i,j1,j2,...,jn)은 x(j1,j2,...,jN)에 대한 u(i,jk)의 편도함수입니다. 여기서 jk는 x의 배치 차원의 요소를 참조합니다.
dim이 2이면, jac(i,j1,j2,...,jn)은 x(j1,j2,...,jN)에 대한 u(jk,i)의 편도함수입니다. 여기서 jk는 x의 배치 차원의 요소를 참조합니다.

버전 내역

R2024b에 개발됨

참고 항목

dljacobian

구문

설명

예제

딥러닝 데이터의 야코비 행렬 계산하기

입력 인수

u — 신경망 또는 모델 함수 출력값 추적되는 dlarray 행렬

x — 입력 데이터 추적되는 dlarray 객체

dim — 연산 차원 양의 정수

tf — 고계 도함수를 활성화할지 지정하는 플래그 true 또는 1 (디폴트 값) | false 또는 0

출력 인수

jac — 야코비 행렬 형식이 지정되지 않은 dlarray 객체

버전 내역

참고 항목

도움말 항목

`u` — 신경망 또는 모델 함수 출력값
추적되는 `dlarray` 행렬

`x` — 입력 데이터
추적되는 `dlarray` 객체

`dim` — 연산 차원
양의 정수

`tf` — 고계 도함수를 활성화할지 지정하는 플래그
`true` 또는 `1` (디폴트 값) | `false` 또는 `0`

`jac` — 야코비 행렬
형식이 지정되지 않은 `dlarray` 객체