주요 콘텐츠

gpucoder.transpose

MATLAB 전치 함수의 최적화된 GPU 구현

설명

B = gpucoder.transpose(A)는 공유 메모리를 사용하여 GPU에서 효율적인 아웃 오브 플레이스(out-of-place) 비켤레 전치를 수행합니다. MATLAB®에서 호출되는 경우(코드 생성 제외) gpucoder.transpose는 내장 함수 transpose를 호출합니다.

예제

예제

모두 축소

이 예제에서는 행렬을 전치하는 CUDA® 코드를 생성합니다.

행렬 입력값 A를 인수로 받는 진입점 함수 myTranspose를 하나의 파일에 작성합니다. gpucoder.transpose 함수를 사용하여 A를 전치하기 위한 GPU 효율적인 구현을 생성합니다.

function B = myTranspose(A)
     B = gpucoder.transpose(A);
end

codegen 함수를 사용하여 CUDA MEX 함수를 생성합니다.

codegen -config coder.gpuConfig('mex') -args {ones(1024,1024,'double')} -report myTranspose

입력 인수

모두 축소

입력 배열로, 벡터 또는 행렬로 지정됩니다.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical | char
복소수 지원 여부:

출력 인수

모두 축소

전치된 배열로, 벡터나 행렬로 반환됩니다.

데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical | char

제한 사항

  • gpucoder.transpose는 2보다 큰 차원의 입력값을 지원하지 않습니다.

버전 내역

R2019a에 개발됨