사전 훈련된 모델
Audio Toolbox™를 사용하면 MATLAB® 및 Simulink®에서 사용 가능한 사전 훈련된 오디오 딥러닝 신경망이 지원됩니다. YAMNet으로 사운드를 찾아 분류하고 CREPE로 피치를 추정합니다. 머신러닝 및 딥러닝 시스템에 입력할 VGGish 또는 OpenL3 특징 임베딩을 추출합니다. i-vector 시스템을 사용하여 화자 인식, 확인, 식별, 구분과 같은 응용 분야를 위한 오디오 신호의 간결한 표현을 생성할 수 있습니다. 음성 활동 감지(VAD)를 수행하려면 detectspeechnn을 사용하십시오.
사전 훈련된 딥러닝 신경망을 사용하려면 Deep Learning Toolbox™가 필요합니다. Audio Toolbox의 사전 훈련된 신경망은 심층 신경망 디자이너 (Deep Learning Toolbox)에서 사용할 수 있습니다.
함수
블록
앱
| 심층 신경망 디자이너 | 딥러닝 신경망을 설계하고 시각화합니다 |
도움말 항목
- Audio Transfer Learning Using Experiment Manager
Configure an experiment that compares the performance of multiple pretrained networks applied to a speech command recognition task using transfer learning.
- Speaker Diarization Using Pretrained AI Models
Use the
speakerEmbeddingsfunction to extract compact speaker representations and perform speaker diarization. (R2024b 이후) - Classify Human Voice Using YAMNet on Android Device (Simulink)
This example shows how to use the Simulink® Support Package for Android® Devices and a pretrained YAMNet network to classify human voices.

