이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.
정확한 분석이나 효율적인 분석 또는 의미 있는 분석을 위해 데이터에 전처리 기법이 필요할 수 있습니다. 데이터 정리는 불량 데이터나 누락된 데이터를 찾아서 제거하고 바꾸는 방법들을 의미합니다. 국소 극값과 급격한 변화를 감지하는 것은 유의한 데이터 추세를 식별하는 데 유용할 수 있습니다. 스케일링은 데이터 경계를 변경하기 위한 처리 기법이고, 평활화와 추세 제거(Detrending)는 데이터에서 잡음과 다항식 추세를 제거하기 위한 처리 기법입니다. 그룹화 및 비닝 방법은 그룹별로 데이터 특성을 식별합니다.
누락된 데이터 정리 | Find, fill, or remove missing data in the Live Editor |
이상값 데이터 정리 | Find, fill, or remove outliers in the Live Editor |
변화 지점 찾기 | Find abrupt changes in data in the Live Editor |
국소 극값 찾기 | Find local maxima and minima in the Live Editor |
데이터 평활화 | Smooth noisy data in the Live Editor |
추세 제거 | Remove polynomial trend from data in the Live Editor |
테이블 결합 | Combine two tables using key variables in the Live Editor |
테이블에서 정리되지 않은 데이터와 누락된 데이터 정리하기
이 예제에서는 테이블에서 누락된 데이터가 있는 행을 찾고, 정리하고, 삭제하는 방법을 보여줍니다.
데이터에서 선형 추세를 제거합니다.
그룹화 변수를 사용하여 데이터 변수를 분류할 수 있습니다.
이 예제에서는 데이터를 그룹화하고 각 그룹에 통계량 함수를 적용하는 방법을 보여줍니다.
이 예제에서는 데이터 변수를 그룹화하고 각 그룹에 함수를 적용하는 방법을 보여줍니다.