Main Content

데이터 전처리

데이터 정리, 평활화, 그룹화

정확한 분석이나 효율적인 분석 또는 의미 있는 분석을 위해 데이터에 전처리 기법이 필요할 수 있습니다. 데이터 정리는 불량 데이터나 누락된 데이터를 찾아서 제거하고 바꾸는 방법들을 의미합니다. 국소 극값과 급격한 변화를 감지하는 것은 유의한 데이터 추세를 식별하는 데 유용할 수 있습니다. 스케일링은 데이터 경계를 변경하기 위한 처리 기법이고, 평활화와 추세 제거(Detrending)는 데이터에서 잡음과 다항식 추세를 제거하기 위한 처리 기법입니다. 그룹화 및 비닝 방법은 그룹별로 데이터 특성을 식별합니다.

데이터 정리기Preprocess and organize column-oriented data (R2022a 이후)

라이브 편집기 작업

누락된 데이터 정리Find, fill, or remove missing data in the Live Editor (R2019b 이후)
이상값 데이터 정리Find, fill, or remove outliers in the Live Editor (R2019b 이후)
변화 지점 찾기Find abrupt changes in data in the Live Editor (R2019b 이후)
국소 극값 찾기Find local maxima and minima in the Live Editor (R2019b 이후)
데이터 평활화Smooth noisy data in the Live Editor (R2019b 이후)
추세 찾기 및 제거Find and remove polynomial or periodic trends from data in the Live Editor (R2019b 이후)
데이터 정규화Center and scale data in the Live Editor (R2021b 이후)
피벗 테이블Summarize tabular data in pivoted table in the Live Editor (R2023b 이후)
그룹별 계산Summarize, transform, or filter by group in the Live Editor (R2021b 이후)

함수

모두 확장

anymissingDetermine if any array element is missing (R2022a 이후)
ismissing누락값 찾기
rmmissing누락된 요소 제거
fillmissing누락된 요소 채우기
fillmissing2Fill missing entries in 2-D data (R2023a 이후)
missing누락값 만들기
standardizeMissing표준 누락값 삽입
isoutlier데이터의 이상값 찾기
filloutliers데이터에서 이상값 감지하고 바꾸기
rmoutliers데이터에서 이상값을 감지하여 제거
movmad이동 중앙값 절대 편차
ischange데이터 내 급격한 변화 찾기
islocalmin국소 최솟값 구하기
islocalmax국소 최댓값 구하기
smoothdata잡음 있는 데이터의 평활화
smoothdata2 Smooth noisy data in two dimensions (R2023b 이후)
movmean이동 평균
movmedian이동 중앙값
detrend다항식 추세 제거
trenddecompFind trends in data (R2021b 이후)
normalize데이터 정규화
rescale배열 요소의 범위 스케일링
discretize데이터를 Bin이나 범주로 그룹화
pivotSummarize tabular data in pivoted table (R2023a 이후)
groupsummary그룹 요약 계산
groupcounts그룹 요소의 개수 (R2019a 이후)
groupfilterFilter by group (R2019b 이후)
grouptransformTransform by group
histcounts히스토그램 Bin 도수
histcounts2이변량 히스토그램 Bin 도수
findgroups그룹을 찾고 그룹 번호 반환
splitapply데이터를 그룹으로 분할하고 함수 적용
rowfun테이블 또는 타임테이블 행에 함수 적용
varfun함수를 테이블 또는 타임테이블 변수에 적용
accumarray벡터 요소 누적

도움말 항목