이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

데이터 전처리

데이터 정리, 스무딩, 그룹화

정확한 분석이나 효율적인 분석 또는 의미 있는 분석을 위해 데이터 세트에 전처리 기법이 필요할 수 있습니다. 데이터 정리는 불량 데이터나 누락된 데이터를 찾아서 제거하고 바꾸는 방법들을 의미합니다. 로컬 극값과 급격한 변화를 감지하는 것은 유의한 데이터 추세를 식별하는 데 유용할 수 있습니다. 스케일링은 데이터 경계를 변경하는 반면, 스무딩과 추세 제거(Detrending)는 데이터에서 잡음과 선형 추세를 제거하는 프로세스입니다. 그룹화와 비닝(Binning) 방법은 데이터 변수 간의 관계를 식별하는 기법입니다.

함수

모두 확장

ismissing누락된 값 찾기
rmmissing누락된 요소 제거
fillmissing누락된 값 채우기
missingCreate missing values
standardizeMissingInsert standard missing values
isoutlier데이터의 이상값 찾기
filloutliers데이터에서 이상값 감지하고 바꾸기
rmoutliersDetect and remove outliers in data
movmadMoving median absolute deviation
ischange데이터 내 급격한 변화 찾기
islocalmin국소 최솟값 구하기
islocalmax국소 최댓값 구하기
smoothdata잡음이 있는 데이터 스무딩
movmean이동 평균
movmedianMoving median
detrend선형 추세(Linear Trend) 제거
normalize데이터 정규화
rescale배열 요소의 범위 스케일링
discretize데이터를 Bin이나 범주로 그룹화
groupsummary그룹 요약 계산
grouptransformTransform by group
histcounts히스토그램 Bin 도수
histcounts2이변량 히스토그램 Bin 도수
findgroups그룹을 찾고 그룹 번호 반환
splitapply데이터를 그룹으로 분할하고 함수 적용
rowfun테이블 또는 타임테이블 행에 함수 적용
varfun함수를 테이블 또는 타임테이블 변수에 적용
accumarray누적(Accumulation)을 사용한 배열 생성

도움말 항목

MATLAB에서 누락된 데이터

데이터 세트의 누락값을 처리합니다.

테이블에서 정리되지 않은 데이터와 누락된 데이터 정리하기

이 예제에서는 테이블에서 누락된 데이터가 있는 행을 찾고, 정리하고, 삭제하는 방법을 보여줍니다.

데이터 스무딩과 이상값 감지

데이터에서 원치 않는 잡음이나 동작을 제거하고, 이상값을 찾고 채우고 제거합니다.

데이터 추세 제거(디트렌딩)

데이터에서 선형 추세를 제거합니다.

그룹화 변수를 사용하여 데이터 분할하기

그룹화 변수를 사용하여 데이터 변수를 분류할 수 있습니다.

데이터를 그룹으로 분할하고 통계량 계산하기

이 예제에서는 데이터를 그룹화하고 각 그룹에 통계량 함수를 적용하는 방법을 보여줍니다.

테이블 데이터 변수를 분할하고 함수 적용하기

이 예제에서는 데이터 변수를 그룹화하고 각 그룹에 함수를 적용하는 방법을 보여줍니다.