mfcc
오디오 신호의 MFCC, 로그 에너지, 델타, 델타-델타 추출
구문
설명
는 하나 이상의 이름-값 인수를 사용하여 옵션을 지정합니다.coeffs = mfcc(___,Name=Value)
예: coeffs = mfcc(audioIn,fs,LogEnergy="replace")는 fsHz로 샘플링된 오디오 입력 신호에 대한 멜 주파수 켑스트럼 계수를 반환합니다. coeffs 벡터의 첫 번째 계수는 로그 에너지 값으로 대체됩니다.
[는 델타, 델타-델타 및 데이터의 각 윈도우에 대응하는 샘플의 위치도 반환합니다. 위에 열거된 모든 구문에 나와 있는 입력을 조합하여 지정할 수 있습니다.coeffs,delta,deltaDelta,loc] = mfcc(___)
mfcc(___)에 출력 인수를 지정하지 않으면 멜 주파수 켑스트럼 계수가 플로팅됩니다. 플로팅하기 전에 계수는 평균 0 및 표준편차 1을 갖도록 정규화됩니다.
입력값이 시간 영역에 있는 경우 계수는 시간에 대해 플로팅됩니다.
입력값이 주파수 영역에 있는 경우 계수는 프레임 번호에 대해 플로팅됩니다.
로그 에너지가 추출되면 이 로그 에너지도 플로팅됩니다.
예제
입력 인수
이름-값 인수
출력 인수
알고리즘
참고 문헌
[1] Rabiner, Lawrence R., and Ronald W. Schafer. Theory and Applications of Digital Speech Processing. Upper Saddle River, NJ: Pearson, 2010.
[2] Auditory Toolbox. https://engineering.purdue.edu/~malcolm/interval/1998-010/AuditoryToolboxTechReport.pdf




