분할
음성과 기타 사운드 감지 및 분리
음성과 기타 사운드를 감지하고 시작 시간과 종료 시간을 찾습니다. 스트리밍 응용 분야의 경우, 음성 활동 감지기(VAD)를 사용해서 지정된 프레임에 음성이 존재할 확률을 출력할 수 있습니다. speech2text를 사용하여 음성 신호에 대한 시간 정렬된 단어 레이블을 만들 수도 있습니다.
앱
| 신호 레이블 지정기 | 관심 있는 신호 특성, 신호 영역 및 신호 지점에 레이블 지정하기 |
객체
voiceActivityDetector | Detect presence of speech in audio signal |
함수
enhanceSpeech | Enhance speech signal (R2024a 이후) |
separateSpeakers | Separate signal by speakers (R2023b 이후) |
detectspeechnn | Detect boundaries of speech in audio signal using AI (R2023a 이후) |
detectSpeech | Detect boundaries of speech in audio signal |
classifySound | Classify sounds in audio signal |
identifyLanguage | Identify languages in speech signals (R2024b 이후) |
블록
| Voice Activity Detector | Detect presence of speech in audio signal |
도움말 항목
- Voice Activity Detection in Audio Toolbox
Compare VAD implementations provided by Audio Toolbox™.
- Speaker Diarization Using Pretrained AI Models
Use the
speakerEmbeddingsfunction to extract compact speaker representations and perform speaker diarization. (R2024b 이후)

