라이브 편집기 작업을 사용하여 정리되지 않은 데이터 정리 및 극값 찾기

라이브 스크립트 열기

각 단계에서 데이터를 시각화하는 일련의 라이브 편집기 작업을 통해 대화형 방식으로 데이터를 전처리할 수 있습니다. 이 예제에서는 국소 최솟값 및 국소 최댓값을 식별하기 위해 5개의 작업을 사용하여 누락값과 이상값을 갖는 잡음이 있는 데이터를 정리합니다. 라이브 편집기 작업에 대한 자세한 내용은 라이브 스크립트에 대화형 방식 작업 추가하기 항목을 참조하십시오.

먼저, 4개의 NaN 값과 5개의 이상값을 포함하는 정리되지 않은 데이터로 구성된 벡터를 만들고 플로팅합니다.

x = 1:100;
data = cos(2*pi*0.05*x+2*pi*rand) + 0.5*randn(1,100);
data(20:20:80) = NaN;
data(10:20:90) = [-50 40 30 -45 35];

정리되지 않은 데이터를 플로팅하려면 플롯 만들기 작업을 여십시오. 먼저, 코드 블록에 키워드 plot을 입력한 후 메뉴에 Create Plot이 나타나면 이를 클릭합니다. 데이터를 플로팅할 플롯 유형과 입력 데이터를 선택합니다.

이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.

Figure contains an axes object. The axes object with title data vs. x, xlabel x, ylabel data contains an object of type line. This object represents data.

누락된 데이터 채우기

데이터에서 NaN 값을 대체하고 결과를 시각화하려면 누락된 데이터 정리 작업을 여십시오. 먼저, 코드 블록에 키워드 missing을 입력한 후 메뉴에 Clean Missing Data가 나타나면 이를 클릭합니다. 입력 데이터와 정리 방법을 선택하여 채워진 데이터를 자동으로 플로팅합니다.

이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.

Figure contains an axes object. The axes object with title Number of filled missing entries: 4 contains 2 objects of type line. One or more of the lines displays its values using only markers These objects represent Cleaned data, Filled missing entries.

이상값 채우기

이제 이상값 데이터 정리 작업을 사용하여 이전 작업에 있는 정리된 데이터에서 이상값을 제거할 수 있습니다. 새 코드 블록에 키워드 outliers를 입력하고 Clean Outlier Data를 클릭하여 작업을 엽니다. cleanedData를 입력 데이터로 선택합니다. 이상값을 정리하고 감지하도록 메서드를 사용자 지정하고, 임계값을 조정하여 찾으려는 이상값의 개수를 늘리거나 줄일 수 있습니다.

이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.

Figure contains an axes object. The axes object with title Number of outliers cleaned: 5 contains 5 objects of type line. One or more of the lines displays its values using only markers These objects represent Input data, Cleaned data, Outliers, Filled outliers, Outlier thresholds.

데이터 평활화하기

다음으로, 데이터 평활화 작업을 사용하여 이전 작업에서 정리된 데이터를 평활화합니다. 키워드 smooth를 입력하고 나타나는 작업을 클릭합니다. 이전 작업의 출력값인 cleanedData2를 입력 데이터로 선택합니다. 평활화 방법을 선택하고 평활화 인자를 조정하여 평활화 정도를 늘리거나 줄입니다.

이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.

Figure contains an axes object. The axes object with title Moving window size: 9 contains 2 objects of type line. These objects represent Input data, Smoothed data.

극값 찾기

마지막으로, 키워드 extrema를 입력한 후 Find Local Extrema를 클릭합니다. smoothedData를 입력 데이터로 사용하고, 정리되고 평활화된 데이터의 국소 최댓값 및 국소 최솟값 모두를 찾도록 극값 유형을 변경합니다. 국소 극값 파라미터를 조정하여 찾으려는 국소 최댓값 및 국소 최솟값의 개수를 늘리거나 줄일 수 있습니다.

이 작업이 생성하는 코드를 확인하려면 작업 파라미터 영역 맨 아래에 있는 을 클릭하여 작업 표시 영역을 확장합니다.

Figure contains an axes object. The axes object with title Number of extrema: 11 contains 3 objects of type line, scatter. These objects represent Input data, Local maxima, Local minima.

참고 항목