주요 콘텐츠

데이터 전처리

데이터 정리, 정규화, 집계 및 분석

데이터 전처리는 원시 데이터를 보다 분석하기 쉬운 형태로 변환하는 과정입니다. 이 과정에는 누락값 처리 또는 잡음이 있는 데이터 평활화 같은 정리 단계가 포함될 수 있습니다. 데이터를 정리하고 구성 및 요약하면 패턴을 파악하여 예측하고 정보에 기반한 의사 결정을 내릴 수 있습니다.

모두 확장

데이터 정리기Preprocess and organize column-oriented data (R2022a 이후)

라이브 편집기 작업

모두 확장

누락된 데이터 정리Find, fill, or remove missing data in the Live Editor
이상값 데이터 정리Find, fill, or remove outliers in the Live Editor
데이터 평활화Smooth noisy data in the Live Editor
국소 극값 찾기Find local maxima and minima in the Live Editor
변화 지점 찾기Find abrupt changes in data in the Live Editor
테이블 변수 쌓기Combine values from multiple table variables into one table variable in the Live Editor
테이블 변수 해체Distribute values from one table variable to multiple table variables in the Live Editor
타임테이블 시간 값 재지정Resample or aggregate timetable data in the Live Editor
데이터 정규화Center and scale data in the Live Editor (R2021b 이후)
추세 찾기 및 제거Find and remove polynomial or periodic trends from data in the Live Editor
피벗 테이블Summarize tabular data in pivoted table in the Live Editor (R2023b 이후)
그룹별 계산라이브 편집기에서 그룹별로 요약, 변환 또는 필터링합니다 (R2021b 이후)

함수

모두 확장

누락값

fillmissing누락된 요소 채우기
fillmissing2Fill missing entries in 2-D data (R2023a 이후)
standardizeMissing표준 누락값 삽입
rmmissing누락된 요소 제거
anymissing배열 요소가 누락되었는지 확인 (R2022a 이후)
ismissing누락값 찾기
missing누락값 만들기

이상값

filloutliers데이터에서 이상값 감지하고 바꾸기
rmoutliers데이터에서 이상값을 감지하여 제거
isoutlier데이터의 이상값 찾기
clipClip data to range (R2024a 이후)
isbetweenDetermine which elements are within specified range
allbetweenDetermine if all elements are within specified range (R2025a 이후)

잡음 감소

smoothdata잡음 있는 데이터의 평활화
smoothdata2 Smooth noisy data in two dimensions (R2023b 이후)
movmean이동 평균
movmedian이동 중앙값
movsum이동 합

국소 극값 및 변화 지점

islocalmin국소 최솟값 구하기
islocalmin2Find local minima in 2-D data (R2024a 이후)
islocalmax국소 최댓값 구하기
islocalmax2Find local maxima in 2-D data (R2024a 이후)
ischange데이터 내 급격한 변화 찾기

샘플링

isuniformDetermine if vector is uniformly spaced (R2022b 이후)
isregular시간 또는 달력 단위와 관련해 입력 시간값이 규칙적인지 확인
retime타임테이블의 데이터 리샘플링 또는 집계 및 중복되거나 불규칙적인 시간값 문제 해결

테이블 형태 변경

rows2varsReorient table or timetable so that rows become variables
stack입력 테이블/타임테이블의 데이터를 출력 테이블/타임테이블의 변수 하나에 쌓기
unstackUnstack data from input table or timetable into multiple variables of output table or timetable

요소 정렬 및 비교

sort배열 요소 정렬
sortrows행렬 또는 테이블의 행 정렬
issortedDetermine if array is sorted
issortedrowsDetermine if matrix or table rows are sorted
unique고유 값
uniquetolUnique values within tolerance
alluniqueDetermine if all values are unique (R2025a 이후)
numuniqueNumber of unique values (R2025a 이후)
ismember데이터 집합의 멤버 찾기
ismembertol허용오차 내에서 데이터 집합의 멤버 찾기

크기 조정

paddataPad data by adding elements (R2023b 이후)
trimdataTrim data by removing elements (R2023b 이후)
resizeResize data by adding or removing elements (R2023b 이후)

정규화

normalize데이터 정규화
rescale배열 요소의 범위 스케일링

추세 찾기 및 제거

detrend다항식 추세 제거
trenddecompFind trends in data (R2021b 이후)

비닝

discretize데이터를 Bin이나 범주로 그룹화
histcounts히스토그램 Bin 도수
histcounts2이변량 히스토그램 Bin 도수

피벗

pivotSummarize tabular data in pivoted table (R2023a 이후)

요약

summaryData summary
groupsummary그룹 요약 계산
groupcounts그룹 요소의 개수
groupfilterFilter by group
grouptransformTransform by group
findgroups그룹을 찾고 그룹 번호 반환
splitapply데이터를 그룹으로 분할하고 함수 적용
accumarray벡터 요소 누적

도움말 항목

데이터 정리

추세 제거

요약

추천 예제