라이브 편집기 작업을 사용하여 정리되지 않은 데이터 정리 및 극값 찾기
각 단계에서 데이터를 시각화하는 일련의 라이브 편집기 작업을 통해 대화형 방식으로 데이터를 전처리할 수 있습니다. 이 예제에서는 국소 최솟값 및 국소 최댓값을 식별하기 위해 5개의 작업을 사용하여 누락값과 이상값을 갖는 잡음이 있는 데이터를 정리합니다. 라이브 편집기 작업에 대한 자세한 내용은 라이브 스크립트에 대화형 방식 작업 추가하기 항목을 참조하십시오.
먼저, 4개의 NaN
값과 5개의 이상값을 포함하는 정리되지 않은 데이터로 구성된 벡터를 만들고 플로팅합니다.
x = 1:100; data = cos(2*pi*0.05*x+2*pi*rand) + 0.5*randn(1,100); data(20:20:80) = NaN; data(10:20:90) = [-50 40 30 -45 35];
정리되지 않은 데이터를 플로팅하려면 플롯 만들기 작업을 여십시오. 먼저, 코드 블록에 키워드 plot
을 입력한 후 메뉴에 Create Plot
이 나타나면 이를 클릭합니다. 데이터를 플로팅할 플롯 유형과 입력 데이터를 선택합니다.
이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.
누락된 데이터 채우기
데이터에서 NaN
값을 대체하고 결과를 시각화하려면 누락된 데이터 정리 작업을 여십시오. 먼저, 코드 블록에 키워드 missing
을 입력한 후 메뉴에 Clean Missing Data
가 나타나면 이를 클릭합니다. 입력 데이터와 정리 방법을 선택하여 채워진 데이터를 자동으로 플로팅합니다.
이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.
이상값 채우기
이제 이상값 데이터 정리 작업을 사용하여 이전 작업에 있는 정리된 데이터에서 이상값을 제거할 수 있습니다. 새 코드 블록에 키워드 outliers
를 입력하고 Clean Outlier Data
를 클릭하여 작업을 엽니다. cleanedData
를 입력 데이터로 선택합니다. 이상값을 정리하고 감지하도록 메서드를 사용자 지정하고, 임계값을 조정하여 찾으려는 이상값의 개수를 늘리거나 줄일 수 있습니다.
이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.
데이터 평활화하기
다음으로, 데이터 평활화 작업을 사용하여 이전 작업에서 정리된 데이터를 평활화합니다. 키워드 smooth
를 입력하고 나타나는 작업을 클릭합니다. 이전 작업의 출력값인 cleanedData2
를 입력 데이터로 선택합니다. 평활화 방법을 선택하고 평활화 인자를 조정하여 평활화 정도를 늘리거나 줄입니다.
이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.
극값 찾기
마지막으로, 키워드 extrema
를 입력한 후 Find Local Extrema
를 클릭합니다. smoothedData
를 입력 데이터로 사용하고, 정리되고 평활화된 데이터의 국소 최댓값 및 국소 최솟값 모두를 찾도록 극값 유형을 변경합니다. 국소 극값 파라미터를 조정하여 찾으려는 국소 최댓값 및 국소 최솟값의 개수를 늘리거나 줄일 수 있습니다.
이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.
참고 항목
라이브 편집기 작업
- 누락된 데이터 정리 | 이상값 데이터 정리 | 변화 지점 찾기 | 국소 극값 찾기 | 데이터 평활화 | 추세 찾기 및 제거
함수
ismissing
|rmmissing
|fillmissing
|isoutlier
|filloutliers
|rmoutliers
|ischange
|islocalmin
|islocalmax
|smoothdata