결함 검출 및 진단을 위한 결정 모델

상태 모니터링에는 결함 상태와 정상 상태를 구분하는 결함 검출, 그리고 결함 상태가 있는 경우 결함 발생의 원인을 확인하는 결함 진단이 포함됩니다. 상태 모니터링 알고리즘을 설계하려면 시스템 데이터에서 추출한 상태 지표를 사용하여 테스트 데이터에서 추출한 지표를 분석해서 현재 시스템의 상태를 확인하는 결정 모델을 훈련합니다. 따라서 이 단계는 알고리즘 설계 과정에서 상태 지표를 식별한 이후에 수행합니다.

(결함 예측에 상태 지표를 사용하는 방법에 대한 자세한 내용은 잔여 수명 예측 모델 항목을 참조하십시오.)

다음은 상태 모니터링을 위한 결정 모델의 몇 가지 예입니다.

지표가 이를 벗어나면 결함을 뜻하게 되는, 상태 지표 값에 대한 임계값 또는 범위의 집합
상태 지표의 특정 값이 특정 유형의 결함을 암시할 가능성을 기술하는 확률 분포
상태 지표의 현재 값을 결함 상태와 연관된 값과 비교하고 특정 결함 상태가 존재할 가능성을 반환하는 분류기

일반적으로 결함 검출 또는 진단을 위한 여러 모델을 테스트할 때는 하나 이상의 상태 지표 값으로 구성된 테이블을 만들게 됩니다. 상태 지표란 여러 정상 작동 상태와 결함 작동 상태를 나타내는 앙상블에 있는 데이터에서 추출한 특징입니다. (모니터링, 결함 검출 및 예측을 위한 상태 지표 항목을 참조하십시오.) 데이터를 결정 모델의 훈련을 위한 서브셋(훈련 데이터)과 검증을 위한 또 하나의 서로소 부분 집합(검증 데이터)으로 분할하는 것이 유용합니다. 서로 중첩하는 데이터 세트를 사용하여 훈련 및 검증을 수행하는 것에 비해, 완전히 분리된 훈련 데이터와 검증 데이터를 사용하면 새로운 데이터를 사용했을 때 결정 모델이 어떻게 작동할지를 더 잘 파악할 수 있습니다.

알고리즘을 설계할 때, 다양한 상태 지표를 사용하여 여러 결함 검출 및 진단 모델을 테스트해 볼 수 있습니다. 따라서 설계 과정의 이 단계는 여러 지표나 이들 지표의 다양한 조합을 시도해 보고 여러 결정 모델을 시험해 보면서 상태 지표를 추출하는 반복적인 과정일 가능성이 높습니다.

Statistics and Machine Learning Toolbox™와 그 밖의 툴박스에는 분류기, 회귀 모델과 같은 결정 모델을 훈련시키는 데 사용할 수 있는 기능이 포함되어 있습니다. 아래에서는 몇 가지 일반적인 접근 방식에 대해 설명합니다.

특징 선택

특징 선택 기법을 사용하면 수행하려는 분석과 관계없는 특징을 제거하여 대규모 데이터 세트를 축소하는 데 도움이 됩니다. 상태 모니터링에서 관계없는 특징이란 정상 작동과 결함 작동을 구분하지 못하거나 여러 결함 상태를 구분하는 데 도움이 되지 않는 특징을 가리킵니다. 즉, 특징 선택은 시스템의 성능 저하가 진행됨에 따라 감지 가능하고 신뢰할 수 있는 방식으로 변해서 상태 지표 역할을 하기 적합한 특징을 식별하는 것을 의미합니다. 다음은 특징 선택을 위한 몇 가지 함수입니다.

pca — 주성분 분석을 수행합니다. 주성분 분석은 관측된 값의 가장 큰 변동을 설명하는 독립 데이터 변수들의 선형 결합을 찾습니다. 예를 들어, 앙상블의 각 멤버에 대해 10개의 독립 센서 신호가 있다고 가정하겠습니다. 여기에서 여러 특징을 추출합니다. 이때 주성분 분석을 사용하면 앙상블에서 표현된 여러 정상 상태와 결함 상태를 분리하는 데 가장 효과적인 특징 또는 특징의 조합을 확인하는 데 도움이 됩니다. 풍력 터빈 고속 베어링 예지진단 예제에서 특징 선택에 대한 이러한 접근 방식을 사용합니다.
sequentialfs — 후보 특징 세트에 더 이상 변별력이 개선되지 않을 때까지 순차적으로 특징을 선택하여 정상 상태와 결함 상태를 가장 잘 구분하는 특징을 식별합니다.
fscnca — 이웃 성분 분석을 사용하여 분류를 위한 특징 선택을 수행합니다. Simulink를 사용하여 결함 데이터 생성하기 예제에서는 이 함수를 사용해 결함 상태 구분에 있어서의 각 상태 지표의 중요도에 따라, 추출된 상태 지표 목록에 가중치를 적용합니다.

특징 선택과 관련 있는 더 많은 함수를 보려면 차원 축소 및 특징 추출 항목을 참조하십시오.

통계 분포 피팅

상태 지표 값과 그에 대응되는 결함 상태로 구성된 테이블이 있으면 값을 통계 분포에 피팅할 수 있습니다. 검증 또는 테스트 데이터를 결과로 생성되는 분포와 비교하면 검증 또는 테스트 데이터가 특정 결함 상태에 해당할 가능성을 얻게 됩니다. 이러한 피팅에 사용할 수 있는 몇 가지 함수는 다음과 같습니다.

ksdensity — 샘플 데이터의 확률 밀도를 추정합니다.
histfit — 데이터에서 히스토그램을 생성하고 이를 정규분포에 피팅합니다. 정상 상태 실험을 사용한 원심 펌프의 결함 진단 예제에서는 이 접근 방식을 사용합니다.
ztest — 데이터가 지정된 평균 및 표준편차를 갖는 정규분포에서 비롯되었을 가능성을 테스트합니다.

통계 분포에 대한 자세한 내용은 확률 분포와 가설검정 항목을 참조하십시오.

머신러닝

결함 검출 및 진단 문제에 머신러닝 기법을 적용하는 방법에는 여러 가지가 있습니다. 분류는 알고리즘이 레이블이 지정된 사례 데이터로부터 새로운 관측값의 분류 방법을 “학습”하는 머신러닝 지도 학습의 한 가지 유형입니다. 결함 검출 및 진단에서는 앙상블에서 도출된 상태 지표와 그에 대응되는 결함 레이블을 분류기를 훈련시키는 알고리즘 피팅 함수에 전달할 수 있습니다.

예를 들어, 여러 정상 상태 및 결함 상태를 포괄하는 데이터 앙상블의 각 멤버를 대상으로 상태 지표 값으로 구성된 테이블을 계산한다고 가정하겠습니다. 이 데이터를 분류기 모델을 피팅하는 함수에 전달할 수 있습니다. 이 훈련 데이터는 새로운 데이터 세트에서 추출한 상태 지표 값 세트를 받아 해당 데이터가 정상 상태와 결함 상태 중 어디에 해당하는지 추측하도록 분류기 모델을 훈련하는 데 사용됩니다. 실제 현장에서는 훈련용으로 앙상블의 일부분을 사용하고, 훈련된 분류기의 검증을 위해 앙상블의 나머지 서로소 부분을 남겨 둡니다.

Statistics and Machine Learning Toolbox에는 분류기를 훈련시키는 데 사용할 수 있는 여러 함수가 있습니다. 이러한 함수의 예는 다음과 같습니다.

fitcsvm — 이진 분류기 모델이 두 개의 상태(예: 결함 상태의 존재와 부재)를 구분하도록 훈련시킵니다. Simulink를 사용하여 결함 데이터 생성하기 예제에서는 이 함수를 사용하여 특징 기반 상태 지표로 구성된 테이블로 분류기를 훈련시킵니다. 정상 상태 실험을 사용한 원심 펌프의 결함 진단 예제에서도 데이터를 정적 모델에 피팅하여 얻은 파라미터의 통계 속성으로부터 계산된 모델 기반 상태 지표에서 이 함수를 사용합니다.
fitcecoc — 분류기가 여러 상태를 구분하도록 훈련시킵니다. 이 함수는 다중 클래스 분류 문제를 이진 분류기의 집합으로 축소합니다. 시뮬레이션된 데이터를 사용한 다중 클래스 결함 검출 예제에서 이 함수를 사용합니다.
fitctree — 문제를 이진 결정 트리 집합으로 축소하여 다중 클래스 분류 모델을 훈련시킵니다.
fitclinear — 고차원 훈련 데이터를 사용하여 분류기를 훈련시킵니다. 이 함수는 fscnca와 같은 함수를 사용하여 축소할 수 없는 다량의 상태 지표가 있는 경우에 유용할 수 있습니다.

그 밖의 머신러닝 기법으로는 데이터를 상호 배타적인 군집으로 분할하는 k-평균 군집화(kmeans) 등이 있습니다. 이 기법에서는 데이터 점에서 할당된 군집의 평균 위치까지의 거리를 최소화하는 방식으로 군집에 새로운 측정값을 할당합니다. 트리 배깅은 분류를 위해 결정 트리 앙상블을 집계하는 또 다른 기법입니다. 정상 상태 실험을 사용한 원심 펌프의 결함 진단 예제에서는 TreeBagger 분류기를 사용합니다.

분류를 위한 머신러닝 기법에 대한 보다 일반적인 정보는 분류 항목을 참조하십시오.

동적 모델을 사용한 회귀

결함 검출 및 진단에 대한 또 다른 접근 방식은 모델 식별을 사용하는 것입니다. 이 접근 방식에서는 정상 상태와 결함 상태에서의 시스템 작동에 대한 동적 모델을 추정합니다. 그런 다음 어느 모델이 시스템의 실시간 측정값을 설명할 가능성이 더 큰지를 분석합니다. 이 접근 방식은 식별을 위해 모델 유형을 선택하는 데 도움이 될 수 있는 시스템 관련 정보를 알고 있는 경우에 유용합니다. 이 접근 방식을 사용하려면 다음을 수행하십시오.

정상 상태로 작동하는 시스템과 알려진 결함 상태, 성능 저하 상태 또는 수명 종료 상태로 작동하는 시스템에서 데이터를 수집하거나 시뮬레이션합니다.
각각의 정상 상태와 결함 상태에서의 동작을 나타내는 동적 모델을 식별합니다.
군집화 기법을 사용하여 여러 상태를 명확히 구분합니다.
작동 중인 기계에서 새 데이터를 수집하여 그 데이터의 동작에 해당하는 모델을 식별합니다. 그러면 정상 상태 모델과 결함 상태 모델 중 어느 것이 관측된 동작을 가장 잘 설명하는지 확인할 수 있습니다.

데이터 기반 모델을 사용한 결함 검출 예제에서는 이 접근 방식을 사용합니다. 동적 모델 식별에 사용할 수 있는 함수는 다음과 같습니다.

forecast와 같은 함수를 사용하여, 식별된 모델의 미래의 동작을 예측할 수 있습니다.

관리도

통계적 공정관리(SPC) 방법은 제조 상품의 품질을 추적 관찰하고 평가하는 기법을 말합니다. SPC는 개발 및 생산 공정을 정의, 측정, 분석, 개선, 제어하는 프로그램에 사용됩니다. 예측 정비 맥락에서 관리도와 관리 규칙은 상태 지표 값이 결함을 나타내는 경우를 판단하는 데 도움이 될 수 있습니다. 예를 들어, 임계값을 초과하면 결함을 의미하는 상태 지표가 있는데 이 상태 지표가 임계값을 넘어섰는지 식별하기 어렵게 만드는 정상 변동도 함께 나타난다고 가정하겠습니다. 이때 관리 규칙을 사용하여, 순차 측정값이 하나가 아니라 지정된 개수만큼 임계값을 초과하면 임계값 상태가 발생한 것으로 정의할 수 있습니다.

controlchart — 관리도를 시각화합니다.
controlrules — 관리 규칙을 정의하고 위반 여부를 확인합니다.
cusum — 데이터 평균값의 작은 변화를 감지합니다.

통계적 공정관리에 대한 자세한 내용은 통계적 공정관리 항목을 참조하십시오.

변화 지점 감지

결함 상태를 검출하는 또 다른 방법은 시간에 따른 상태 지표의 값을 추적하고 그 추세에서 급격한 변화를 감지하는 것입니다. 이러한 급격한 변화는 결함을 나타낼 수 있습니다. 변화 지점 감지에 사용할 수 있는 함수는 다음과 같습니다.

findchangepts — 신호에서 급격한 변화를 찾습니다.
findpeaks — 신호에서 피크를 찾습니다.
pdist, pdist2, mahal — 거리에 대한 서로 다른 정의에 따라, 측정값 사이의 거리 또는 측정값 세트 사이의 거리를 구합니다.
segment — 데이터를 분할하고 각각의 AR, ARX, ARMA 또는 ARMAX 모델을 추정합니다. 데이터 기반 모델을 사용한 결함 검출 예제에서는 이 접근 방식을 사용합니다.