이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

라이브 편집기 작업을 사용하여 정리되지 않은 데이터 정리 및 극값 찾기

각 단계에서 데이터를 시각화하는 일련의 라이브 편집기 작업을 통해 대화형 방식으로 데이터를 전처리할 수 있습니다. 이 예제에서는 국소 최솟값 및 국소 최댓값을 식별하기 위해 4개의 작업을 사용하여 결측값과 이상값을 갖는 잡음이 있는 데이터를 정리합니다. 라이브 편집기 작업에 대한 자세한 내용은 라이브 스크립트에 대화형 방식 작업 추가하기 항목을 참조하십시오.

먼저, 4개의 NaN 값과 5개의 이상값을 포함하는 정리되지 않은 데이터로 구성된 벡터를 만들고 플로팅합니다.

x = 1:100;
data = cos(2*pi*0.05*x+2*pi*rand) + 0.5*randn(1,100);
data(20:20:80) = NaN;
data(10:20:90) = [-50 40 30 -45 35];
plot(x,data)

누락된 데이터 채우기

데이터에서 NaN 값을 대체하고 결과를 시각화하려면 누락된 데이터 정리 작업을 여십시오. 먼저, 코드 블록에 키워드 missing을 입력한 후 메뉴에 Clean Missing Data가 나타나면 이를 클릭합니다. 입력 데이터와 정리 방법을 선택하여 채워진 데이터를 자동으로 플로팅합니다.

이상값 채우기

이제 이상값 데이터 정리 작업을 사용하여 이전 작업에 있는 정리된 데이터에서 이상값을 제거할 수 있습니다. 새 코드 블록에 키워드 outliers를 입력하고 Clean Outlier Data를 클릭하여 작업을 엽니다. cleanedData를 입력 데이터로 선택합니다. 이상값을 정리하고 감지하도록 메서드를 사용자 지정하고, 임계값을 조정하여 찾으려는 이상값의 개수를 늘리거나 줄일 수 있습니다.

데이터 스무딩하기

다음으로, 데이터 스무딩 작업을 사용하여 이전 작업에서 정리된 데이터를 스무딩합니다. 키워드 smooth를 입력하고 나타나는 작업을 클릭합니다. 이전 작업의 출력값인 cleanedData2를 입력 데이터로 선택합니다. 스무딩 방법을 선택하고 스무딩 인자를 조정하여 스무딩 정도를 늘리거나 줄입니다.

극값 찾기

마지막으로, 키워드 extrema를 입력한 후 Find Local Extrema를 클릭합니다. smoothedData를 입력 데이터로 사용하고, 정리되고 스무딩된 데이터의 국소 최댓값 및 국소 최솟값 모두를 찾도록 극값 유형을 변경합니다. 국소 극값 파라미터를 조정하여 찾으려는 국소 최댓값 및 국소 최솟값의 개수를 늘리거나 줄일 수 있습니다.

코드 생성하기

작업에서 출력값 및 시각화를 생성하는 데 사용된 코드를 보려면 플롯 위의 작업 창 맨 아래에 있는 화살표를 클릭하십시오.

이 작업은 코드 블록을 표시합니다. 코드 블록은 잘라서 붙여 넣어 기존의 스크립트나 다른 프로그램에 사용하거나 나중에 수정할 수 있습니다. 예를 들면 다음과 같습니다.

이제 기본 코드가 라이브 스크립트의 일부이므로 작업에서 생성된 변수를 향후 처리에 계속해서 사용할 수 있습니다. 예를 들어, maxIndices를 사용하여 스무딩된 데이터에서 대응하는 국소 최댓값을 찾은 후 평균을 계산할 수 있습니다.

참고 항목

라이브 편집기 작업

함수

관련 항목