Main Content

오디오 처리

오디오 및 음성 처리 응용 분야에서 딥러닝 워크플로 확장

Deep Learning Toolbox™를 Audio Toolbox™와 함께 사용하여 오디오 및 음성 처리 응용 분야에 딥러닝을 적용합니다. 신호 처리 응용 분야에 대해서는 신호 처리 항목을 참조하십시오. 무선 통신 응용 분야에 대해서는 무선 통신 항목을 참조하십시오.

신호 레이블 지정기관심 있는 신호 특성, 신호 영역, 신호 지점에 레이블 지정 및 특징 추출

함수

모두 확장

audioDatastoreDatastore for collection of audio files
audioDataAugmenterAugment audio data (R2019b 이후)
audioFeatureExtractorStreamline audio feature extraction (R2019b 이후)
openl3EmbeddingsExtract OpenL3 feature embeddings (R2022a 이후)
pitchnnEstimate pitch with deep learning neural network (R2021a 이후)
vggishEmbeddingsExtract VGGish feature embeddings (R2022a 이후)
audioPretrainedNetworkPretrained audio neural networks (R2024a 이후)
classifySoundClassify sounds in audio signal (R2020b 이후)
pitchnnEstimate pitch with deep learning neural network (R2021a 이후)
vggishEmbeddingsExtract VGGish feature embeddings (R2022a 이후)
openl3EmbeddingsExtract OpenL3 feature embeddings (R2022a 이후)
detectspeechnnDetect boundaries of speech in audio signal using AI (R2023a 이후)
separateSpeakersSeparate signal by speakers (R2023b 이후)

블록

모두 확장

VGGishVGGish embeddings extraction network (R2022a 이후)
VGGish EmbeddingsExtract VGGish embeddings (R2022a 이후)
YAMNetYAMNet sound classification network (R2021b 이후)
Sound ClassifierClassify sounds in audio signal (R2021b 이후)
OpenL3OpenL3 embeddings extraction network (R2022b 이후)
OpenL3 EmbeddingsExtract OpenL3 embeddings (R2022b 이후)
CREPECREPE deep pitch estimation neural network (R2023a 이후)
Deep Pitch EstimatorEstimate pitch with CREPE deep learning neural network (R2023a 이후)

도움말 항목