gpuDevice

GPU 장치 쿼리 또는 선택

설명

GPUDevice 객체는 컴퓨터에 있는 GPU(그래픽 처리 장치)를 나타냅니다. GPU를 사용하면 gpuArray 변수를 지원하는 MATLAB^® 코드를 실행하거나 CUDAKernel 객체를 사용하여 CUDA^® 커널을 실행할 수 있습니다.

GPUDevice 객체를 사용하여 GPU 장치의 속성을 검사하거나, GPU 장치를 재설정하거나, GPU가 계산 실행을 마칠 때까지 대기할 수 있습니다. GPUDevice 객체를 가져오려면 gpuDevice 함수를 사용하십시오. gpuDevice 함수를 사용하여 GPU 장치를 선택하거나 선택 취소할 수도 있습니다. 여러 GPU에 액세스할 수 있는 경우에는 gpuDevice 함수를 사용하여 코드를 실행할 특정 GPU 장치를 선택하십시오.

GPU에서 함수를 실행하기 위해 GPUDevice 객체를 사용할 필요는 없습니다. GPU 지원 함수의 사용 방법에 대한 자세한 내용은 GPU에서 MATLAB 함수 실행하기 항목을 참조하십시오.

생성

구문

gpuDevice

D = gpuDevice

D = gpuDevice(ind)

gpuDevice([])

설명

gpuDevice는 현재 선택된 GPU 장치의 속성을 표시합니다. 현재 선택된 장치가 없는 경우 gpuDevice는 디폴트 장치를 선택하며 그 내용을 지우지 않습니다. GPU 장치의 속성을 검사하려는 경우 이 구문을 사용하십시오.

D = gpuDevice는 현재 선택된 장치를 나타내는 GPUDevice 객체를 반환합니다. 현재 선택된 장치가 없는 경우 gpuDevice는 디폴트 장치를 선택하며, 그 내용을 지우지 않고 이 장치를 나타내는 GPUDevice 객체를 반환합니다.

예제

D = gpuDevice(ind)는 인덱스 ind로 지정된 GPU 장치를 선택합니다. 지정된 GPU 장치가 지원되지 않는 경우에는 오류가 발생합니다. 이 구문은 지정된 장치가 이미 현재 선택되어 있는 경우에도 이 장치를 재설정하고 장치의 메모리를 지웁니다(reset 함수와 동일). gpuArray 또는 CUDAKernel 변수를 나타내는 모든 작업 공간 변수는 이제 유효하지 않으므로, 작업 공간에서 지우거나 다시 정의해야 합니다.

예제

gpuDevice([])는 빈 인수를 가지며(인수가 없는 것이 아님), GPU 장치를 선택 취소하고 장치의 메모리에서 gpuArray 및 CUDAKernel 변수를 지웁니다. 이 구문을 실행하면 현재 장치로 선택된 GPU 장치가 없게 됩니다.

예제

입력 인수

모두 확장

`ind` — GPU 장치의 인덱스
정수

GPU 장치의 인덱스로, 1에서 gpuDeviceCount 사이의 정수로 지정됩니다.

예: gpuDevice(1);

속성

모두 확장

ID

`Name` — GPU 장치의 이름
읽기 전용: 문자형 배열

읽기 전용 속성입니다.

GPU 장치의 이름으로, 문자형 배열로 지정됩니다. 장치에 할당되는 이름은 GPU 장치 모델에서 도출됩니다.

데이터형: char

`Index` — GPU 장치의 인덱스
읽기 전용: 정수

읽기 전용 속성입니다.

GPU 장치의 인덱스로, 1에서 gpuDeviceCount 사이의 정수로 지정됩니다. 이 인덱스를 사용하여 특정 GPU 장치를 선택합니다.

`UUID` — 범용 고유 식별자
읽기 전용: 문자형 배열

R2024a 이후

읽기 전용 속성입니다.

장치의 범용 고유 식별자(UUID)로, 문자형 배열로 지정됩니다.

UUID는 일반적으로 'GPU-'로 시작하고 36자의 16진수 시퀀스를 포함합니다. 동일해 보이는 GPU여도 UUID를 사용하면 구분할 수 있습니다.

데이터형: char

상태

`DeviceSelected` — 현재 선택된 장치에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

읽기 전용 속성입니다.

현재 선택된 장치에 대한 플래그이며, 논리값 0(false) 또는 1(true)로 지정됩니다.

데이터형: logical

`DeviceAvailable` — 사용 가능한 장치에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

읽기 전용 속성입니다.

사용 가능한 장치에 대한 플래그이며, 논리값 0(false) 또는 1(true)로 지정됩니다. 이 속성은 현재 MATLAB 세션에서 장치를 사용할 수 있는지 여부를 나타냅니다. DeviceSupported 속성값이 0(false)인 지원되지 않는 장치는 언제나 사용할 수 없습니다. ComputeMode 속성이 'Exclusive thread', 'Exclusive process' 또는 'Prohibited'로 설정된 경우에도 장치를 사용할 수 없습니다.

데이터형: logical

`DeviceSupported` — 지원되는 장치에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

읽기 전용 속성입니다.

지원되는 장치에 대한 플래그이며, 논리값 0(false) 또는 1(true)로 지정됩니다. 일부 장치는 지원되지 않습니다(예: ComputeCapability가 불충분한 장치).

데이터형: logical

`LastAccessed` — 장치에 마지막으로 액세스한 날짜 및 시간
읽기 전용: `datetime`형 배열

R2024b 이후

읽기 전용 속성입니다.

현재 MATLAB 세션에서 장치에 마지막으로 액세스한 날짜 및 시간으로, datetime형 스칼라 배열로 지정됩니다. 이 세션에서 장치에 액세스하지 않았다면 LastAccessed는 Not-a-Time(NaT)입니다.

MATLAB에서 GPU 장치를 사용하는 대부분의 경우 LastAccessed가 업데이트됩니다. 업데이트되는 경우에는 다음이 포함됩니다.

gpuDevice를 사용하여 장치를 선택하는 경우.
reset을 사용하여 장치를 초기화하는 경우.
gpuArray를 생성하거나 사용하는 경우.

현재 선택한 장치의 속성을 쿼리하는 경우에는 LastAccessed가 업데이트되지 않습니다.

데이터형: datetime

메모리

`TotalMemory` — 총 메모리
읽기 전용: 스칼라

읽기 전용 속성입니다.

장치의 총 메모리(단위: 바이트)로, 스칼라 값으로 지정됩니다. 이 값은 장치가 자체 내부 사용을 위해 일부 메모리를 예약하기 때문에 NVIDIA^® System Management Interface에서 보고하는 값과 다를 수 있습니다.

데이터형: double

`AvailableMemory` — 데이터에 사용 가능한 총 메모리
읽기 전용: 스칼라

읽기 전용 속성입니다.

데이터에 사용 가능한 총 메모리(단위: 바이트)로, 스칼라 값으로 지정됩니다. 이 속성은 현재 선택된 장치에만 사용할 수 있습니다. 이 값은 메모리 캐싱으로 인해 NVIDIA System Management Interface가 보고한 값과 다를 수 있습니다.

데이터형: double

`CachePolicy` — GPU 장치의 현재 캐싱 정책
`'balanced'` | `'minimum'` | `'maximum'`

R2023a 이후

GPU 장치의 캐싱 정책으로, 'balanced', 'minimum' 또는 'maximum'으로 지정됩니다. 캐싱 정책은 계산을 가속화하기 위해 캐시할 수 있는 GPU 메모리 양을 결정하며, 다음 값 중 하나로 지정됩니다.

'minimum' – GPU 장치에서 캐시할 수 있는 메모리 양이 매우 적습니다.
'balanced' – GPU 장치에서 캐시할 수 있는 메모리 양이 균형을 이룹니다. 이 정책은 GPU 메모리 사용량과 계산 성능 간의 균형을 제공합니다.
'maximum' – GPU 장치에 캐시할 수 있는 메모리 양이 장치의 총 메모리에 의해서만 제한됩니다.

디폴트 값은 'Default' 또는 'Prohibited' 계산 모드에 있는 장치의 경우 'balanced'이고, 'Exclusive process' 계산 모드에 있는 장치의 경우 'maximum'입니다. 계산 모드 속성에 대한 자세한 내용은 ComputeMode 항목을 참조하십시오.

참고

reset을 사용하여 장치를 재설정하거나, gpuDevice([])를 사용하여 장치를 지우거나, gpuDevice를 사용하여 다른 장치를 선택하면 캐싱 정책이 디폴트 정책으로 재설정됩니다.
GPUDevice 객체가 포함된 MAT 파일을 저장하고 불러와도 캐싱 정책은 유지되지 않습니다.
선택하지 않은 장치의 캐싱 정책은 설정할 수 없습니다. 예를 들어 첫 번째 GPUDevice 객체를 배열에 저장하고 다른 장치를 선택한 후에는 첫 번째 GPUDevice 객체의 캐싱 정책을 설정할 수 없습니다.

데이터형: char | string

드라이버

`GraphicsDriverVersion` — 사용 중인 그래픽스 드라이버 버전
읽기 전용: 문자형 배열

R2023a 이후

읽기 전용 속성입니다.

GPU 장치가 현재 사용 중인 그래픽스 드라이버 버전으로, 문자형 배열로 지정됩니다.

GPU를 위한 최신 그래픽스 드라이버는 NVIDIA 드라이버 다운로드 페이지에서 다운로드하십시오.

데이터형: char

`DriverModel` — 그래픽스 드라이버의 운영 모델
읽기 전용: `'WDDM'` | `'TCC'` | `'MCDM'` (R2026a 이후) | `'N/A'`

R2023a 이후

읽기 전용 속성입니다.

그래픽스 드라이버의 운영 모델로, 다음 값 중 하나로 지정됩니다.

'WDDM' – Windows^® Display Driver Model (WDDM)을 사용합니다.
'TCC' – Tesla Compute Cluster (TCC) 드라이버 모델을 사용합니다.
'MCDM' – Microsoft^® Compute Driver Model을 사용합니다. (R2026a 이후)
'N/A' – 'WDDM', 'TCC' 및 'MCDM'는 Windows에서만 사용할 수 있습니다. 기타 운영 체제에서는 드라이버 모델이 'N/A'입니다.

'TCC'와 'MCDM'은 Windows 그래픽스 기능을 비활성화하여 대규모 계산의 성능을 향상시킬 수 있습니다.

모델 변경 및 'TCC'와 'MCDM'를 지원하는 GPU 장치에 대한 자세한 내용은 NVIDIA 문서를 참조하십시오.

데이터형: char

`ComputeMode` — 계산 모드
읽기 전용: `'Default'` | `'Exclusive process'` | `'Prohibited'`

읽기 전용 속성입니다.

장치의 계산 모드로, 다음 값 중 하나로 지정됩니다.

`'Default'`	장치가 제한되지 않으며, 여러 애플리케이션에서 이 장치를 동시에 사용할 수 있습니다. MATLAB은 다른 MATLAB 세션 또는 워커를 포함하여 다른 애플리케이션과 장치를 공유할 수 있습니다.
`'Exclusive process'`	한 번에 하나의 애플리케이션만 장치를 사용할 수 있습니다. MATLAB에서 장치가 선택되어 있는 동안, 다른 MATLAB 세션 또는 워커를 포함한 다른 애플리케이션에서 이 장치를 사용할 수 없습니다.
`'Prohibited'`	장치를 사용할 수 없습니다.

GPU 장치의 계산 모드 변경에 대한 자세한 내용은 NVIDIA 문서를 참조하십시오.

데이터형: char

`KernelExecutionTimeout` — 장시간 실행되는 커널의 시간 제한 여부에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

읽기 전용 속성입니다.

장시간 실행되는 커널의 시간 제한 여부에 대한 플래그로, 0(false) 또는 1(true)로 지정됩니다. KernelExecutionTimeout이 1(true)인 경우 운영 체제가 CUDA 커널 실행에 허용되는 시간의 상한값을 설정합니다. 이 시간이 지나면 CUDA 드라이버가 커널의 실행을 자동으로 중단하고 오류를 반환합니다.

데이터형: logical

기능

`ComputeCapability` — GPU 장치의 계산 성능
읽기 전용: 문자형 배열

읽기 전용 속성입니다.

GPU 장치의 계산 성능으로, 문자형 배열로 지정됩니다. 선택한 GPU 장치를 MATLAB에서 사용하려면 ComputeCapability가 GPU 연산 요구 사항에 나와 있는 필수 사양을 충족해야 합니다.

데이터형: char

`MultiprocessorCount` — 스트리밍 멀티프로세서 개수
읽기 전용: 스칼라

읽기 전용 속성입니다.

장치에 있는 스트리밍 멀티프로세서 개수로, 스칼라 값으로 지정됩니다.

데이터형: double

`ClockRateKHz` — 피크 클록 속도
읽기 전용: 스칼라

읽기 전용 속성입니다.

GPU의 피크 클록 속도(단위: kHz)로, 스칼라 값으로 지정됩니다.

데이터형: double

`SingleDoubleRatio` — 배정밀도 FPU에 대한 단정밀도 FPU의 비율
읽기 전용: 스칼라

R2024b 이후

읽기 전용 속성입니다.

장치의 배정밀도 부동소수점 장치(FPU)에 대한 단정밀도 부동소수점 장치(FPU)의 비율로, 스칼라 값으로 지정됩니다.

이 비율은 장치의 배정밀도 처리 성능을 기준으로 한 단정밀도 처리 성능을 나타냅니다. 선형 시스템을 푸는 것과 같은 배정밀도 계산에 적합한 장치는 일반적으로 이 비율이 낮습니다. 심층 신경망을 훈련시키고 그래픽스를 렌더링하는 것과 같은 단정밀도 계산에 적합한 장치는 일반적으로 이 비율이 높습니다.

데이터형: double

커널 프로그래밍

`MaxThreadsPerBlock` — 지원되는 최대 블록당 스레드 수
읽기 전용: 스칼라

읽기 전용 속성입니다.

CUDAKernel 실행 중에 지원되는 최대 블록당 스레드 수로, 스칼라 값으로 지정됩니다.

예: 1024

데이터형: double

`MaxShmemPerBlock` — 지원되는 최대 공유 메모리 크기
읽기 전용: 스칼라

읽기 전용 속성입니다.

CUDAKernel 실행 중에 스레드 블록이 사용할 수 있는 공유 메모리의 지원되는 최대 크기로, 스칼라 값으로 지정됩니다.

데이터형: double

`MaxThreadBlockSize` — 스레드 블록의 각 차원의 최대 크기
읽기 전용: 벡터

읽기 전용 속성입니다.

스레드 블록의 각 차원의 최대 크기로, 벡터로 지정됩니다. 스레드 블록의 각 차원은 이러한 차원 값을 초과해서는 안 됩니다. 또한 스레드 블록 크기의 곱은 MaxThreadsPerBlock을 초과해서는 안 됩니다.

예: [1024 1024 64]

데이터형: double

`MaxGridSize` — 스레드 블록 그리드의 최대 크기
읽기 전용: 벡터

읽기 전용 속성입니다.

스레드 블록 그리드의 최대 크기로, 벡터로 지정됩니다.

예: [2.1475e+09 65535 65535]

데이터형: double

`SIMDWidth` — 동시에 실행되는 스레드 수
읽기 전용: 스칼라

읽기 전용 속성입니다.

동시에 실행되는 스레드 수로, 스칼라 값으로 지정됩니다.

데이터형: double

`ToolkitVersion` — CUDA 툴킷 버전
읽기 전용: 스칼라

읽기 전용 속성입니다.

현재 MATLAB 릴리스에서 사용하는 CUDA 툴킷 버전으로, 스칼라 값으로 지정됩니다.

데이터형: double

객체 함수

`reset`	GPU 장치를 재설정하고 메모리를 지웁니다.
`wait (GPUDevice)`	Wait for GPU calculation to complete

다음 함수도 사용할 수 있습니다.

`parallel.gpu.GPUDevice.isAvailable(ind)`	인덱스 `ind`로 지정된 GPU가 지원되고 이 GPU를 선택할 수 있으면 논리값 `1` 또는 `true`를 반환합니다. `ind`는 정수이거나 정수로 구성된 벡터일 수 있습니다. 디폴트 인덱스는 현재 장치입니다.
`parallel.gpu.GPUDevice.getDevice(ind)`	`GPUDevice` 객체를 선택하지 않고 반환합니다.

전체 함수 목록을 보려면 다음과 같이 GPUDevice 객체에 대해 methods 함수를 사용하십시오.

methods('parallel.gpu.GPUDevice')

다음 명령을 사용하면 원하는 객체 함수에 대한 도움말을 볼 수 있습니다.

help parallel.gpu.GPUDevice.functionname

여기서 functionname은 함수의 이름입니다. 예를 들어, isAvailable에 대한 도움말을 보려면 다음을 입력하십시오.

help parallel.gpu.GPUDevice.isAvailable

예제

모두 축소

GPU 장치를 식별하고 선택하기

라이브 스크립트 열기

이 예제에서는 gpuDevice를 사용하여 사용할 장치를 식별 및 선택하는 방법을 보여줍니다.

컴퓨터에서 사용할 수 있는 GPU 장치 수를 확인하려면 gpuDeviceCount 함수를 사용하십시오.

gpuDeviceCount("available")

ans = 
2

장치가 여러 대 있는 경우 첫 번째가 디폴트 값입니다. gpuDeviceTable 함수로 장치의 속성을 검토하여 그 장치를 사용할지 여부를 결정할 수 있습니다.

gpuDeviceTable

ans=2×5 table
    1    "NVIDIA RTX A5000"    "8.6"    true     true
    2    "NVIDIA RTX A5000"    "8.6"    true    false

첫 번째 장치가 사용할 장치인 경우 계속 진행하면 됩니다. GPU에서 계산을 실행하려면 gpuArray 지원 함수를 사용하십시오. 자세한 내용은 GPU에서 MATLAB 함수 실행하기 항목을 참조하십시오.

MATLAB®이 GPU를 사용할 수 있는지 확인하려면 canUseGPU 함수를 사용하십시오. 이 함수는 계산에 사용할 수 있는 GPU가 있으면 1(true)을 반환하고, 그렇지 않으면 0(false)을 반환합니다.

canUseGPU

ans = logical
   1

GPU 설정 문제(예: canUseGPU가 0(false)을 반환하는 경우)를 진단하려면 validateGPU 함수를 사용하십시오. GPU 유효성 검사는 선택 사항입니다.

validateGPU

# Beginning GPU validation
# Performing system validation
#    CUDA-supported platform .................................................PASSED
#    CUDA-enabled graphics driver exists .....................................PASSED
#        Version: 570.133.07
#    CUDA-enabled graphics driver load .......................................PASSED
#    CUDA environment variables ..............................................PASSED
#        CUDA_VISIBLE_DEVICES: "0,1"
#    CUDA device count .......................................................PASSED
#        Found 2 devices.
#    GPU libraries load ......................................................PASSED
# 
# Performing device validation for device index 1
#    Device exists ...........................................................PASSED
#        NVIDIA RTX A5000
#    Device supported ........................................................PASSED
#    Device available ........................................................PASSED
#        Device is in 'Default' compute mode.
#    Device selectable .......................................................PASSED
#    Device memory allocation ................................................PASSED
#    Device kernel launch ....................................................PASSED
# 
# Finished GPU validation with no failures.

다른 장치를 사용하려면 사용할 장치의 인덱스를 지정하여 gpuDevice 함수를 호출하십시오.

gpuDevice(2)

ans = 
  CUDADevice with properties:

                 Name: 'NVIDIA RTX A5000'
                Index: 2 (of 2)
    ComputeCapability: '8.6'
          DriverModel: 'N/A'
          TotalMemory: 25294995456 (25.29 GB)
      AvailableMemory: 25073221632 (25.07 GB)
      DeviceAvailable: true
       DeviceSelected: true

  Show all properties.

또는 MATLAB® 데스크탑에서, 사용 가능한 GPU 장치 수를 확인하고, 몇 가지 속성을 검사하고, 사용할 장치를 선택할 수 있습니다. 홈 탭의 환경 영역에서 병렬연산 GPU 환경 선택을 선택합니다.

The Select GPU Environment menu showing two NVIDIA RTX A5000 GPUs.

Compute Capability 쿼리하기

라이브 스크립트 열기

디폴트 GPU 장치를 나타내는 객체를 만들고 Compute Capability를 쿼리합니다.

D = gpuDevice;
D.ComputeCapability

ans = 
'8.6'

사용 가능한 모든 GPU 장치의 Compute Capability를 쿼리합니다.

for idx = 1:gpuDeviceCount
    D = gpuDevice(idx);
    disp("Device " + D.Index + " has compute capability " + D.ComputeCapability)
end

Device 1 has compute capability 8.6
Device 2 has compute capability 8.6

gpuDeviceTable을 사용하여 시스템에 있는 GPU 장치의 Compute Capability와 가용성을 비교합니다.

gpuDeviceTable

ans=2×5 table
    1    "NVIDIA RTX A5000"    "8.6"    true    false
    2    "NVIDIA RTX A5000"    "8.6"    true     true

캐싱 정책 쿼리 및 변경

라이브 스크립트 열기

GPU의 캐싱 정책을 변경합니다.

디폴트 GPU 장치를 나타내는 객체를 만듭니다.

D = gpuDevice

D = 
  CUDADevice with properties:

                 Name: 'NVIDIA RTX A5000'
                Index: 1 (of 2)
    ComputeCapability: '8.6'
          DriverModel: 'TCC'
          TotalMemory: 25544294400 (25.54 GB)
      AvailableMemory: 25120866304 (25.12 GB)
      DeviceAvailable: true
       DeviceSelected: true

  Show all properties.

GPU 장치의 CachePolicy 속성에 액세스합니다.

D.CachePolicy

ans = 
'balanced'

계산을 가속화하기 위해 GPU가 최대 메모리 양을 캐시할 수 있도록 캐싱 정책을 변경합니다.

D.CachePolicy = "maximum";
D.CachePolicy

ans = 
'maximum'

속성을 []로 설정하여 캐싱 정책을 디폴트 정책으로 재설정합니다.

D.CachePolicy = [];

reset(D)를 호출하거나 gpuDevice로 다른 장치를 선택하면 캐싱 정책도 디폴트 값으로 재설정됩니다.

병렬 풀에서 다중 GPU 사용하기

라이브 스크립트 열기

여러 개의 GPU에 액세스할 수 있는 경우에는 병렬 풀을 사용하여 여러 개의 GPU에서 병렬로 계산을 수행할 수 있습니다.

MATLAB에서 사용 가능한 GPU 개수를 확인하려면 gpuDeviceCount 함수를 사용하십시오.

availableGPUs = gpuDeviceCount("available")

availableGPUs = 
3

사용 가능한 GPU와 같은 수의 워커를 사용하여 병렬 풀을 시작합니다. MATLAB은 최적의 성능을 위해 기본적으로 각 워커에 다른 GPU를 할당합니다.

parpool("Processes",availableGPUs);

Starting parallel pool (parpool) using the 'Processes' profile ...
Connected to the parallel pool (number of workers: 3).

각 워커가 사용하는 GPU를 식별하려면 spmd 블록 내에서 gpuDevice를 호출하십시오. spmd 블록은 모든 워커에서 gpuDevice를 실행합니다.

spmd
    gpuDevice
end

parfor 또는 parfeval과 같은 병렬 언어 기능을 사용하여 계산을 병렬 풀의 워커로 분산합니다. 계산에 gpuArray 지원 함수를 사용하는 경우 이러한 함수는 워커의 GPU에서 실행됩니다. 자세한 내용은 GPU에서 MATLAB 함수 실행하기 항목을 참조하십시오. 예제는 Run MATLAB Functions on Multiple GPUs 항목을 참조하십시오.

계산이 완료되면 병렬 풀을 종료합니다. gcp 함수를 사용하여 현재 병렬 풀을 가져올 수 있습니다.

delete(gcp("nocreate"));

다른 GPU를 선택하려면 gpuDevice를 사용하여 GPU 장치 인덱스를 통해 각 워커에서 특정 GPU를 선택할 수 있습니다. gpuDeviceCount 함수를 사용하여 시스템에 있는 각 GPU 장치의 인덱스를 가져올 수 있습니다.

시스템에 3개의 GPU가 있지만 2개만 계산에 사용하려 한다고 가정하겠습니다. 장치의 인덱스를 가져옵니다.

[availableGPUs,gpuIndx] = gpuDeviceCount("available")

availableGPUs = 
3

gpuIndx = 1×3

    1    2    3

사용할 장치의 인덱스를 정의합니다.

useGPUs = [1 3];

병렬 풀을 시작합니다. spmd 블록과 gpuDevice를 사용하여 장치 인덱스를 통해 각 워커를 사용하려는 GPU 중 하나와 연결합니다. spmdIndex 함수는 각 워커의 인덱스를 식별합니다.

parpool("Processes",numel(useGPUs));

Starting parallel pool (parpool) using the 'Processes' profile ...
Connected to the parallel pool (number of workers: 2).

spmd
    gpuDevice(useGPUs(spmdIndex));
end

최상의 성능을 구현하려면 각 워커에 다른 GPU를 할당하는 것이 좋습니다.

계산이 완료되면 병렬 풀을 종료합니다.

delete(gcp("nocreate"));

팁

원격 GPU의 속성을 쿼리하려면 클러스터를 사용하여 병렬 풀을 시작한 후, spmd 블록 내에서 gpuDevice 함수를 호출하십시오. 워커가 하나 이상의 GPU를 보유한 경우 gpuDeviceTable를 대신 사용하십시오.
```
cluster = parcluster("myRemoteGPUCluster");
pool = parpool(cluster);

spmd
  D = gpuDevice
end
```
원격 GPU 사용에 대한 자세한 내용은 Work with Remote GPUs 항목을 참조하십시오.

확장 기능

모두 확장

스레드 기반 환경
MATLAB®의 `backgroundPool`을 사용해 백그라운드에서 코드를 실행하거나 Parallel Computing Toolbox™의 `ThreadPool`을 사용해 코드 실행 속도를 높일 수 있습니다.

gpuDevice 함수는 스레드 기반 환경을 완전히 지원합니다. 자세한 내용은 스레드 기반 환경에서 MATLAB 함수 실행하기 항목을 참조하십시오.

버전 내역

R2010b에 개발됨

모두 확장

R2026a: 드라이버 모델이 MCDM으로 보고됨

Microsoft Compute Driver Model (MCDM)을 사용하는 장치의 경우, DriverModel 속성이 이제 'MCDM'으로 변경되었습니다.

R2024b: 새로운 장치 속성 및 화면 표시 업데이트

gpuDevice 함수를 사용하여 GPU 장치의 다음과 같은 새로운 속성을 검사할 수 있습니다.

LastAccessed — 현재 MATLAB 세션에서 장치에 마지막으로 액세스한 날짜 및 시간입니다.
SingleDoubleRatio — 장치의 배정밀도 부동소수점 장치(FPU)에 대한 단정밀도 부동소수점 장치(FPU)의 비율입니다.

이제 GPUDevice 객체를 만들거나 쿼리하면 Name, Index, ComputeCapability, DriverModel, TotalMemory, AvailableMemory, DeviceAvailable, DeviceSelected 속성만 표시됩니다. 장치의 모든 속성을 보려면 출력 표시를 차단하지 않고 GPUDevice 객체를 만들거나 쿼리하고 Show all properties 링크를 클릭하십시오.

D = gpuDevice

D = 

  CUDADevice with properties:

                 Name: 'NVIDIA RTX A5000'
                Index: 1 (of 2)
    ComputeCapability: '8.6'
          DriverModel: 'TCC'
          TotalMemory: 25544294400 (25.54 GB)
      AvailableMemory: 25120866304 (25.12 GB)
      DeviceAvailable: true
       DeviceSelected: true

  Show all properties.

SupportsDouble, GPUOverlapsTransfers, CanMapHostMemory 속성은 더 이상 표시되지 않지만 점 표기법을 사용하여 이러한 속성을 계속 쿼리할 수 있습니다. 이러한 속성을 제거할 계획은 없습니다.

R2024a: GPU의 UUID를 사용하여 GPU 식별

GPUDevice 객체의 UUID 속성을 사용하여 GPU의 범용 고유 식별자(UUID)를 확인합니다. 동일해 보이는 GPU여도 UUID를 사용하면 구분할 수 있습니다.

예를 들어 gpuDeviceTable 함수를 사용하여 두 GPU의 UUID를 검사할 수 있습니다.

gpuDeviceTable(["Index","Name","UUID"])

    Index           Name                              UUID                   
    _____    __________________    __________________________________________

      1      "NVIDIA RTX A5000"    "GPU-957b509e-322a-ae88-59c8-b7435d0f98f4"
      2      "NVIDIA RTX A5000"    "GPU-6f3ad2c0-5ea1-b1a2-1dca-cd756d10dbc0"
      3      "NVIDIA RTX A5000"    "GPU-41c24f34-c915-919b-0bb3-20d07117e0ec"
      4      "NVIDIA RTX A5000"    "GPU-23ab01ce-2f42-2d0c-0f6b-db7ac8c10867"

또는 gpuDevice 함수를 사용하여 GPU를 선택하고 해당 GPU의 UUID를 쿼리할 수 있습니다.

D = gpuDevice;
D.UUID

    'GPU-957b509e-28ca-ae88-59c8-b7435d0f98f4'

R2023a: 장치 속성 변경

현재 사용 중인 그래픽스 드라이버 버전을 표시하기 위해 GraphicsDriverVersion 속성이 추가되었습니다.
Windows에서 그래픽스 드라이버의 운영 모델을 표시하기 위해 DriverModel 속성이 추가되었습니다.
GPU 메모리 캐싱 정책을 변경할 수 있도록 CachePolicy 속성이 추가되었습니다.
DriverVersion 속성은 더 이상 기본적으로 표시되지 않지만 점 표기법을 사용하여 속성을 쿼리할 수 있습니다. DriverVersion 속성을 제거할 계획은 없습니다.

참고 항목

도움말 항목

외부 웹사이트

Deep Learning with GPUs and MATLAB

gpuDevice

설명

생성

구문

설명

입력 인수

ind — GPU 장치의 인덱스 정수

속성

ID

Name — GPU 장치의 이름 읽기 전용: 문자형 배열

Index — GPU 장치의 인덱스 읽기 전용: 정수

UUID — 범용 고유 식별자 읽기 전용: 문자형 배열

상태

DeviceSelected — 현재 선택된 장치에 대한 플래그 읽기 전용: 0 (false) | 1 (true)

DeviceAvailable — 사용 가능한 장치에 대한 플래그 읽기 전용: 0 (false) | 1 (true)

DeviceSupported — 지원되는 장치에 대한 플래그 읽기 전용: 0 (false) | 1 (true)

LastAccessed — 장치에 마지막으로 액세스한 날짜 및 시간 읽기 전용: datetime형 배열

메모리

TotalMemory — 총 메모리 읽기 전용: 스칼라

AvailableMemory — 데이터에 사용 가능한 총 메모리 읽기 전용: 스칼라

CachePolicy — GPU 장치의 현재 캐싱 정책 'balanced' | 'minimum' | 'maximum'

드라이버

GraphicsDriverVersion — 사용 중인 그래픽스 드라이버 버전 읽기 전용: 문자형 배열

DriverModel — 그래픽스 드라이버의 운영 모델 읽기 전용: 'WDDM' | 'TCC' | 'MCDM' (R2026a 이후) | 'N/A'

ComputeMode — 계산 모드 읽기 전용: 'Default' | 'Exclusive process' | 'Prohibited'

KernelExecutionTimeout — 장시간 실행되는 커널의 시간 제한 여부에 대한 플래그 읽기 전용: 0 (false) | 1 (true)

기능

ComputeCapability — GPU 장치의 계산 성능 읽기 전용: 문자형 배열

MultiprocessorCount — 스트리밍 멀티프로세서 개수 읽기 전용: 스칼라

ClockRateKHz — 피크 클록 속도 읽기 전용: 스칼라

SingleDoubleRatio — 배정밀도 FPU에 대한 단정밀도 FPU의 비율 읽기 전용: 스칼라

커널 프로그래밍

MaxThreadsPerBlock — 지원되는 최대 블록당 스레드 수 읽기 전용: 스칼라

MaxShmemPerBlock — 지원되는 최대 공유 메모리 크기 읽기 전용: 스칼라

MaxThreadBlockSize — 스레드 블록의 각 차원의 최대 크기 읽기 전용: 벡터

MaxGridSize — 스레드 블록 그리드의 최대 크기 읽기 전용: 벡터

SIMDWidth — 동시에 실행되는 스레드 수 읽기 전용: 스칼라

ToolkitVersion — CUDA 툴킷 버전 읽기 전용: 스칼라

객체 함수

예제

GPU 장치를 식별하고 선택하기

Compute Capability 쿼리하기

캐싱 정책 쿼리 및 변경

병렬 풀에서 다중 GPU 사용하기

팁

확장 기능

스레드 기반 환경 MATLAB®의 backgroundPool을 사용해 백그라운드에서 코드를 실행하거나 Parallel Computing Toolbox™의 ThreadPool을 사용해 코드 실행 속도를 높일 수 있습니다.

버전 내역

R2026a: 드라이버 모델이 MCDM으로 보고됨

R2024b: 새로운 장치 속성 및 화면 표시 업데이트

R2024a: GPU의 UUID를 사용하여 GPU 식별

R2023a: 장치 속성 변경

참고 항목

도움말 항목

외부 웹사이트

`ind` — GPU 장치의 인덱스
정수

`Name` — GPU 장치의 이름
읽기 전용: 문자형 배열

`Index` — GPU 장치의 인덱스
읽기 전용: 정수

`UUID` — 범용 고유 식별자
읽기 전용: 문자형 배열

`DeviceSelected` — 현재 선택된 장치에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

`DeviceAvailable` — 사용 가능한 장치에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

`DeviceSupported` — 지원되는 장치에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

`LastAccessed` — 장치에 마지막으로 액세스한 날짜 및 시간
읽기 전용: `datetime`형 배열

`TotalMemory` — 총 메모리
읽기 전용: 스칼라

`AvailableMemory` — 데이터에 사용 가능한 총 메모리
읽기 전용: 스칼라

`CachePolicy` — GPU 장치의 현재 캐싱 정책
`'balanced'` | `'minimum'` | `'maximum'`

`GraphicsDriverVersion` — 사용 중인 그래픽스 드라이버 버전
읽기 전용: 문자형 배열

`DriverModel` — 그래픽스 드라이버의 운영 모델
읽기 전용: `'WDDM'` | `'TCC'` | `'MCDM'` (R2026a 이후) | `'N/A'`

`ComputeMode` — 계산 모드
읽기 전용: `'Default'` | `'Exclusive process'` | `'Prohibited'`

`KernelExecutionTimeout` — 장시간 실행되는 커널의 시간 제한 여부에 대한 플래그
읽기 전용: `0` (`false`) | `1` (`true`)

`ComputeCapability` — GPU 장치의 계산 성능
읽기 전용: 문자형 배열

`MultiprocessorCount` — 스트리밍 멀티프로세서 개수
읽기 전용: 스칼라

`ClockRateKHz` — 피크 클록 속도
읽기 전용: 스칼라

`SingleDoubleRatio` — 배정밀도 FPU에 대한 단정밀도 FPU의 비율
읽기 전용: 스칼라

`MaxThreadsPerBlock` — 지원되는 최대 블록당 스레드 수
읽기 전용: 스칼라

`MaxShmemPerBlock` — 지원되는 최대 공유 메모리 크기
읽기 전용: 스칼라

`MaxThreadBlockSize` — 스레드 블록의 각 차원의 최대 크기
읽기 전용: 벡터

`MaxGridSize` — 스레드 블록 그리드의 최대 크기
읽기 전용: 벡터

`SIMDWidth` — 동시에 실행되는 스레드 수
읽기 전용: 스칼라

`ToolkitVersion` — CUDA 툴킷 버전
읽기 전용: 스칼라

스레드 기반 환경
MATLAB®의 `backgroundPool`을 사용해 백그라운드에서 코드를 실행하거나 Parallel Computing Toolbox™의 `ThreadPool`을 사용해 코드 실행 속도를 높일 수 있습니다.