GPU Coder

NVIDIA GPU에서 사용 가능한 CUDA 코드를 생성

GPU Coder는 MATLAB 코드와 Simulink 모델로부터 최적화된 CUDA^® 코드를 생성합니다. 생성된 코드는 딥러닝, 임베디드 비전, 레이다 및 신호 처리 알고리즘 내 병렬화 가능 부분에 대한 CUDA 커널을 포함합니다. 생성된 CUDA를 프로파일링하여 병목 지점 및 성능 최적화의 기회를 식별할 수 있습니다. 생성된 코드는 높은 성능을 위해 NVIDIA^® TensorRT™를 호출할 수 있습니다. 생성된 CUDA를 프로젝트에 소스 코드 또는 정적/동적 라이브러리로서 통합하고 NVIDIA Jetson™, NVIDIA DRIVE®, NVIDIA Clara™ 플랫폼에 임베딩된 GPU 등의 최신 NVIDIA GPU에 맞게 컴파일할 수 있습니다. Jetson 및 DRIVE 플랫폼에서 주변기기에 액세스하고 수작업으로 작성된 CUDA를 생성된 코드에 통합할 수 있습니다.

GPU Coder는 MATLAB 코드와 생성된 CUDA 간의 추적을 수행할 수 있는 양방향 링크를 제공합니다. (Embedded Coder^® 사용).

MATLAB에서 CUDA 코드 생성

MATLAB 알고리즘으로부터 생성된 CUDA 코드를 데스크탑 RTX 카드부터 데이터 센터, 임베디드 Jetson 및 DRIVE 플랫폼에 이르기까지 널리 쓰이는 NVIDIA GPU에 대해 컴파일하고 실행할 수 있습니다. 생성된 코드는 고객에게 사용료 없이 무료로 배포할 수 있습니다.

안개 보정 알고리즘에 사용 가능한 CUDA 코드 생성 (2:22)

문서 | 예제

Simulink에서의 CUDA 코드 생성

GPU Coder와 Simulink Coder를 함께 사용하여 Simulink 모델로부터 CUDA 코드를 생성하고 NVIDIA GPU에 배포할 수 있습니다. NVIDIA GPU에서 Simulink 시뮬레이션의 계산 집약적 부분을 가속화할 수 있습니다.

NVIDIA GPU를 위한 Simulink에서의 딥러닝: GPU Coder를 사용한 CUDA 코드 생성 (3:29)

문서 | 예제

NVIDIA Jetson 및 DRIVE로의 배포

GPU Coder는 생성된 코드를 NVIDIA Jetson 및 DRIVE 플랫폼에 배포하는 작업을 자동화합니다. 주변기기에 액세스하고 센서 데이터를 수집하며 알고리즘과 주변기기 인터페이스 코드를 보드에 배포하여 단독으로 실행할 수 있습니다.

GPU Coder를 사용한 프로토타이핑과 NVIDIA DRIVE 및 Jetson 배포 (2:54)

문서 | 예제

Simulink의 차량 및 차선 감지 애플리케이션에 포함되어 도로 교통 상황을 보여주는 두 개의 카메라 뷰.

딥러닝에 사용 가능한 코드 생성

미리 정의되거나 사용자 지정된 다양한 딥러닝 신경망을 NVIDIA GPU에 배포할 수 있습니다. 훈련된 딥러닝 신경망과 더불어 전처리나 후처리에 사용되는 코드를 생성하여 전체 알고리즘을 배포할 수 있습니다.

NVIDIA GPU를 위한 Simulink에서의 딥러닝: ECG 신호 분류 (7:35)

문서 | 예제

FP32 및 INT8 데이터형 사용에 따른 초당 영상 증가폭을 보여주는 “Inference with ResNet-50”, 즉 “ResNet-50을 사용한 추론”이라는 제목의 막대 차트.

생성된 코드 최적화

GPU Coder는 메모리 관리, 커널 융합, 자동 조정을 포함한 최적화를 자동으로 적용합니다. INT8 또는 bfloat16 코드를 생성하여 메모리 사용량을 줄일 수 있습니다. TensorRT와 통합하여 성능을 더욱 향상할 수 있습니다.

TensorRT를 사용하여 NVIDIA GPU에서 보행자 감지하기 (1:34)

문서 | 예제

생성된 코드의 프로파일링 정보를 보여주는 GPU 성능 분석기 툴의 리포트.

생성된 코드의 프로파일링 및 분석

GPU 성능 분석기를 사용하여 생성된 CUDA 코드를 프로파일링하고 실행 속도와 메모리 사용량을 더욱 개선할 기회를 식별할 수 있습니다.

문서 | 예제

스텐실 처리 설계 패턴이 개념적 수준에서 작동하는 방식을 보여주는 다이어그램.

설계 패턴을 사용한 성능 향상

가능하다면 스텐실 처리 및 축소를 포함한 설계 패턴이 자동으로 적용되어 생성된 코드의 성능을 향상할 수 있습니다. 특정 프라그마를 사용하여 직접 호출할 수도 있습니다.

문서 | 예제

MATLAB 코드와 생성된 CUDA 코드 간의 대화형 방식 양방향 추적성을 보여주는 코드 생성 리포트.

신호 기록, 파라미터 조정 및 코드 동작 검증

Simulink Coder와 GPU Coder를 함께 사용하면 실시간으로 신호를 기록하고 파라미터를 조정할 수 있습니다. MATLAB과 생성된 CUDA 코드 간의 대화형 방식 추적을 위해 Embedded Coder를 추가하여 생성된 CUDA 코드의 동작을 SIL 테스트를 통해 수치적으로 검증할 수 있습니다.

생성된 CUDA 코드와 MATLAB 소스 코드 간의 추적

문서 | 예제

가속화에 쓰이는 GPU Coder와 NVIDIA GPU를 사용한 ECG 예측 알고리즘의 Simulink 모델.

MATLAB 및 Simulink 시뮬레이션 가속화

생성된 CUDA 코드를 MATLAB 코드로부터 MEX 함수로서 호출하여 실행 속도를 높일 수 있습니다. GPU Coder와 Simulink Coder를 함께 사용하면 NVIDIA GPU에서 Simulink 모델에 있는 MATLAB Function 블록의 계산 집약적 부분을 가속화할 수 있습니다.

GPU Coder를 사용하여 NVIDIA GPU에서 레이다 시뮬레이션 가속화하기 (3:24)

문서 | 예제