시계열 분석은 일정한 시간 간격으로 기록된 데이터 점을 분석하는 데 사용되는 통계 기법입니다. 패턴, 추세, 계절적 변동을 파악하는 데 도움이 될 수 있으므로 시간 경과에 따른 결과를 전망하는 데 유용합니다.
시계열 데이터를 다루는 엔지니어와 과학자는 시계열 분석을 사용하여 시스템 거동을 모니터링, 모델링, 예측함으로써 시스템을 최적화하고 전망 정확도를 개선할 수 있습니다.
시계열 데이터의 구성요소
시계열 데이터는 기본 패턴을 이해하고 전망하는 데 도움이 되는 몇 가지 기본 구성요소로 나눌 수 있습니다.
구성요소 | 정의 | 예 | |
![]() |
추세 | 시간 경과에 따른 데이터의 전반적인 방향(예: 증가, 감소 또는 일정) | EV 기술 도입, 스타트업 기업의 수익 창출 |
![]() |
계절성 | 일별, 월별 또는 연간 등 일정 기간 동안 반복되는 데이터 패턴 | 여름철 전력 수요 최고치 |
![]() |
순환 변동 | 수년에 걸쳐 발생하는 데이터의 반복적이지만 비계절성 패턴 | 부동산 시장 주기 |
![]() |
불규칙 변동 | 다른 구성요소로는 설명할 수 없는 예측 불가능한 기복 | 예상치 못한 사건으로 인한 갑작스러운 주식 시장 폭락 |
시계열 분석 단계
시계열 데이터 분석에는 시간 경과에 따라 수집된 데이터 점들을 이해, 모델링 및 전망하기 위한 다양한 기법을 통합하는 체계적인 접근 방식이 포함됩니다.
탐색적 데이터 분석
분해
분해는 시계열 데이터를 기본 구성요소인 추세, 계절, 순환 그리고 나머지로 분해하여 기본 패턴 분석과 데이터 해석을 용이하게 하는 데 사용되는 기법입니다.
![데이터에 대한 곡선 1개와 분해된 구성요소에 대한 4개의 추가 곡선을 보여주는 시계열 분석의 플롯.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_2113015877/51228219-8e9c-4d90-a9dc-8042b6ca1b66/image.adapt.full.medium.png/1738167831903.png)
trenddecomp
함수를 통해 구현된 특이 스펙트럼 분석(Singular Spectrum Analysis) 알고리즘을 사용하여 시계열 데이터셋을 장기 추세, 계절 패턴 및 나머지로 분해. (MATLAB 코드 보기.)
모델 선택 및 피팅
모델 선택에서는 계절성, 추세, 정상성과 같은 특성을 기반으로 기본 데이터 패턴을 포착하기에 가장 적합한 모델을 찾습니다. 모델 피팅은 선택한 모델이 관측된 데이터와 예측 간의 차이를 최소화할 수 있도록 훈련하는 데 중점을 두어 모델이 새로운 데이터에 잘 일반화되도록 합니다.
모델 예측 및 전망
모델 예측 및 전망에서는 이전 단계에서 훈련된 모델을 새로운 데이터에 적용하여 과거의 패턴을 기반으로 미래의 데이터 점을 생성합니다.
모델 평가
모델 평가에는 모델의 성능과 모델의 예측 정확도를 평가하는 작업이 포함됩니다. 이는 다음과 같은 세 가지 주요 구성요소로 이루어집니다.
- 성능 메트릭: RMSE(RMS 오차)와 같은 메트릭은 예측값과 실제값의 차이를 계산하여 모델의 정확도를 측정합니다.
- 검증 기법: 교차 검증, 백테스트 및 기타 기법은 새로운 데이터셋에 대한 예측 성능을 평가하여 모델의 안정성을 평가합니다.
- 해석 가능성 방법: LIME(Local Interpretable Model-agnostic Explanation) 및 SHAP(Shapley Additive Explanation)와 같은 기법은 모델 예측을 이해하는 데 도움이 되어 모델의 결정을 더욱 투명하게 만들어 줍니다.
![RMSE 값의 분포를 보여주는 시계열 분석에 사용되는 히스토그램으로, 강조 표시된 이상 시퀀스와 비교를 위한 기준 참조가 포함되어 있습니다.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1877876223/6de26e5d-6752-43ac-ba63-30f9941aaae8/image.adapt.full.medium.png/1738167831963.png)
새로운 데이터에 대한 RMSE 값의 분포를 시각화하여 이상 시퀀스 식별. (MATLAB 코드 보기.)
![LIME을 사용한 심층 신경망의 분류 결정 해석을 보여주는 컬러맵.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1877876223/fa5291a2-2d17-4501-a6b9-3a4c0187578d/image.adapt.full.medium.png/1738167831979.png)
imageLIME
함수를 사용한 신경망 예측 시각화(MATLAB 코드 보기.)
시계열 모델링에 대한 일반적인 접근 방식
시계열 데이터를 모델링하는 세 가지 일반적인 접근 방식은 기존의 전망 모델, 머신러닝 모델, 딥러닝 모델입니다.
기존 전망 모델
기존 전망 모델은 통계적 기법을 사용하여 기본 데이터 패턴과 추세를 식별하고 모델링합니다.
ARIMA(자기회귀 누적 이동평균) 통계 모델은 과거 데이터를 분석하여 미래 값을 예측합니다. 추세와 계절성을 포착하므로 정상성 및 비정상성 데이터셋에 모두 적용할 수 있으며 주가와 매출 같은 단기 및 중기 전망에 적합합니다.
![ARIMA 모델의 5스텝 사전 예측을 비교하는 2차원 플롯으로, 피팅률 78.76%는 검증 데이터에 대한 모델의 성능을 나타냄.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1095866753/44ade517-18ee-408b-86d5-eb35e900e704/image.adapt.full.medium.png/1738167832068.png)
시계열 전망을 위해 System Identification Toolbox를 사용한 ARIMA 모델 추정. (MATLAB 코드 보기.)
지수 평활화 모델은 과거 관측값에 기하급수적으로 감소하는 가중치를 적용하여 최신 데이터에 우선 순위를 부여합니다. 이 방법은 시계열 데이터의 기본 추세와 패턴을 포착하면서 단기 변동을 효과적으로 평활화합니다. 특히 추세나 계절성이 있는 데이터에 유용합니다.
머신러닝 모델
머신러닝 모델은 기존 모델이 놓칠 수 있는 데이터의 복잡한 패턴을 포착할 수 있습니다.
랜덤 포레스트 모델은 여러 결정 트리를 구축하고 그 출력을 결합하여 시계열 분석의 예측 정확도를 향상합니다. 대규모의 고차원 데이터셋을 처리하며 과적합에 강합니다. 과거 데이터를 예측 변수로 사용하여 비선형 관계와 상호 작용을 포착하므로 불규칙한 패턴을 모델링하는 데 적합합니다.
SVM(서포트 벡터 머신)은 분류 및 회귀에 사용되는 지도 학습 모델입니다. 시계열 분석에서 비선형 관계를 모델링하고 고차원 데이터, 특히 작고 복잡한 데이터셋을 처리할 수 있습니다. 예를 들어, SVM은 과거 소비, 기상, 경제 지표 간의 비선형적 상호 작용을 포착하여 에너지 수요를 전망할 수 있습니다.
![ARR, CHF, NSR을 보여주는 ECG 데이터에 대한 시계열 분석의 2차원 플롯 4개.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1057052550/13ba3d09-7abe-4e08-a861-852c32676289/image.adapt.full.medium.png/1738167832139.png)
ARR(부정맥), CHF(울혈성 심부전), NSR(정상 동율동)을 구별하기 위해 신호 처리, 웨이블릿 기반 특징 추출, SVM(서포트 벡터 머신) 분류기를 사용한 ECG 신호 분류를 보여주는 플롯. (MATLAB 코드 보기.)
딥러닝 모델
딥러닝은 데이터에서 직접 패턴과 종속성을 자동으로 학습하여 시계열 분석을 향상합니다. 이러한 모델은 단기 변동과 장기 추세를 모두 포착하므로 전망 및 이상 감지에 이상적입니다.
LSTM(장단기 기억) 모델은 기억 셀과 게이팅 메커니즘을 사용하여 기존 RNN의 한계를 극복하도록 설계된 특수한 유형의 RNN(순환 신경망)입니다. 이러한 설계 덕분에 장기 종속성을 효과적으로 포착할 수 있어 LSTM은 전망 및 시퀀스 예측과 같은 시계열 분석 작업에 특히 유용합니다.
![5개의 추가 전망 사이클을 포함하여 4개의 입력 데이터 사이클을 보여주는 시계열 분석의 2차원 플롯.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_2118520215/a344761c-6d6c-4fdb-8b64-f5a6c1f4d5a7/image_1634535254.adapt.full.medium.png/1738167832182.png)
폐루프 전망을 위해 간단한 LSTM(장단기 기억) 신경망을 사용한 시계열 데이터 예측. (MATLAB 코드 보기.)
CNN(컨벌루션 신경망)은 컨벌루션 계층을 사용하여 데이터에서 특징을 자동으로 추출할 수 있기 때문에 시계열 분석에 사용됩니다. 국소 패턴과 계층 구조를 식별하므로 다변량 시계열 분류와 같은 작업의 단기 종속성을 확인하는 데 효과적입니다.
![인체 ECG 신호의 시계열 분석에 사용되는 시간-주파수 표현을 보여주는 스케일로그램.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_582677468/874d935e-e925-407f-9291-b93e8358d5fc/image.adapt.full.medium.png/1738167832248.png)
웨이블릿 분석 및 딥러닝을 사용한 시계열 데이터 분류. (MATLAB 코드 보기.)
![시간 스텝 전체에 걸쳐 12개의 특징을 보여주는 시계열 분석의 2차원 플롯.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_582677468/718e577f-ef0a-4055-a459-7aa5ca2c521f/image.adapt.full.medium.png/1738167832264.png)
1차원 컨벌루션을 사용한 시퀀스 분류. (MATLAB 코드 보기.)
시계열 분석의 유형
시계열 분석은 데이터 추세와 패턴을 효과적으로 기술, 설명, 전망, 최적화하는 범주로 분류할 수 있습니다.
- 기술 분석은 데이터셋의 주요 특징을 요약합니다. 데이터의 기본 패턴, 추세 및 계절적 변동을 이해하는 데 도움이 됩니다.
- 설명적 분석은 데이터 내에서의 관계 및 인과 효과를 이해하는 것을 목표로 합니다. 기본 인자와 상관관계를 조사하여 특정 패턴이나 추세가 발생하는 이유를 설명하고자 합니다.
- 예측 분석은 과거 데이터, 통계 모델, 머신러닝 알고리즘을 사용하여 미래의 추세와 패턴을 예측합니다.
- 처방 분석은 예측 인사이트를 기반으로 권장 사항과 조치를 제시합니다. 다양한 시나리오와 잠재적 결과를 평가하여 최적의 결정을 제안합니다.
시계열 분석의 과제
시계열 분석에서 자주 걸림돌이 되는 특정 유형의 장애가 있습니다. 데이터 수집 중에 센서나 계측기가 일관되지 않은 간격으로 데이터를 기록하는 것이 보통이며, 이는 단조 증가하는 데이터를 처리하도록 설계된 많은 시계열 모델에서 문제가 됩니다. 데이터 준비에는 누락 데이터, 이상값, 잡음 및 기타 불규칙성을 처리하는 작업뿐만 아니라 균일한 간격을 만들기 위해 데이터를 재추출하는 작업이 포함될 수 있습니다. 위에서 설명한 탐색적 데이터 분석 기법은 이러한 문제를 완화하는 데 도움이 될 수 있습니다.
또한 시계열 데이터에 내재된 계절성과 순환적 패턴은 모델을 선택하고 피팅하는 과정을 복잡하게 만들 수 있습니다. 데이터셋과 적용 가능한 모델링 옵션에 대한 확실한 이해가 좋은 출발점입니다. 교차 검증 및 기타 확립된 모델 검증 기법과 함께 개략적으로 설명된 모델링 접근 방식이 이러한 경우에 도움이 될 것입니다.
경제 및 금융 분석: 경제 지표와 금융 시장을 이해하며, 리스크 관리 및 전략적 계획 수립에 대한 인사이트를 제공합니다.
환경 모니터링: 지속적인 환경 모니터링을 수행하며, 기후 리스크를 평가하여 장기적인 추세와 리스크를 이해하는 데 도움이 됩니다.
예측 정비: 장비 고장을 예측하고 정비 일정을 최적화하여 가동 중단 시간과 운영 비용을 줄입니다.
신호 처리: IoT 기기, 센서 및 상태 시스템의 신호를 해석하여 성능을 개선하고 이상을 감지하며 신뢰성을 향상합니다.
시계열 분석의 예제
시계열 분석에는 시간이 지남에 따라 변화하는 데이터를 이해하고 전망하는 기법이 포함됩니다. 아래 예제는 다양한 응용 사례를 통해 복잡한 데이터셋에서 의미 있는 인사이트를 추출하는 고유한 방법과 툴을 중점적으로 설명합니다.
로마 프리타 지진 분석
타임스탬프로 기록한 지진 데이터를 타임테이블에 저장하는 방법과, 지진 활동을 이해하기 위해 timetable
함수를 사용하여 특정 시간 간격으로 지반 가속도를 분석하고 시각화하는 방법을 알아봅니다.
![지진 활동을 이해하기 위한 속도 및 위치 데이터의 시계열 분석 시각화.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_831475414/eb9e694a-66e0-4207-a294-ce69c7f96d71/image.adapt.full.medium.png/1738167832431.png)
가속도 성분의 시계열. (MATLAB 코드 보기.)
시간-주파수 분석에 대한 실용적 입문
DTMF(이중톤 다중 주파수) 톤과 같은 비정상성 신호를 분석하기 위해 기본적인 시간-주파수 분석을 수행하고 해석하는 방법을 알아봅니다.
![DTMF 톤의 주파수와 출력을 보여주는 스펙트로그램.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_831475414/fa510ebb-b8ce-4f84-a149-a6ac46441e6f/image.adapt.full.medium.png/1738167832460.png)
전화 키패드의 번호 508에 대응하는 DTMF 톤의 지속 시간과 순서를 보여 주는 스펙트로그램으로, 키패드 입력의 두 번째 열에 해당하는 1336Hz를 강조 표시하고 있음. (MATLAB 코드 보기.)
다변량 시계열 전망
먹이 밀집 시나리오에서 포식자 개체군과 피식자 개체군으로부터 측정한 데이터를 대상으로 다변량 시계열 예측을 수행하는 방법을 알아봅니다.
![다양한 모델에서 예측한 반응을 보여주는 선 그래프.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_960282012/58f5f72b-32da-441d-b641-6fde4fc3b9bf/image.adapt.full.medium.png/1738167832527.png)
ARMA, 다항식 AR, GP(가우스 과정), 그레이박스 모델을 사용한 포식자-피식자 개체군에 대한 비교 전망 분석. (MATLAB 코드 보기.)
LSTM을 사용한 ECG 신호 분류
LSTM 신경망과 시간-주파수 분석을 사용하여 ECG 데이터를 분류하는 방법을 알아봅니다.
![ECG 신호의 순시 주파수를 보여주는 2개의 선 그래프 세트.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_960282012/9436f0ae-bd9e-4a2b-ab42-5af5993263d8/image.adapt.full.medium.png/1738167832556.png)
정상 ECG 신호와 AFib(심방세동) ECG 신호의 순시 주파수 비교. (MATLAB 코드 보기.)
더 알아보기
타임테이블을 사용하여 시계열 분석을 위한 데이터 준비
누락값 처리 및 이상값 관리와 같은 전처리 작업 전후에 시간 기반 연산을 사용할 계획이라면 데이터를 시계열 분석에 적합한 형식으로 변환해야 합니다. timetable
함수는 타임스탬프가 지정된 데이터를 처리하도록 설계되었으며, 각 행과 시간을 연결하고 동일한 개수의 행을 갖는 열 방향 변수들을 저장합니다. 데이터 정렬, 결합, 계산을 위한 시간 관련 함수와 동기화 및 재추출과 같은 특징을 제공하여 시계열 분석을 간소화합니다.
![자전거 통행량과 실외 온도를 별도의 Y축에 표시하는 2차원 플롯.](https://kr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_673420312/27bf6009-9273-435f-9a06-4b671028cb61/image.adapt.full.medium.png/1738167832784.png)
타임스탬프가 지정된 센서 데이터를 타임테이블 데이터 컨테이너로 정리하고 전처리하여 자전거 교통 패턴 분석. (MATLAB 코드 보기.)
MATLAB은 특정 응용 분야에 맞춰 사용자의 전체 워크플로를 지원하는 특화된 툴박스를 제공합니다.
응용 분야 | 시계열 분석 다음 단계 | 툴박스 및 주요 특징 | 예제 및 자료 |
통계 및 머신러닝 | 통계 모델 및 머신러닝 알고리즘을 적용하여 시계열 데이터 모델링 | Statistics and Machine Learning Toolbox™
|
시계열 데이터 분석 |
경제 예측 | 시계열 예측과 가설검정 등 계량경제 모델링 및 분석 수행 |
|
승법 ARIMA 모델 추정 |
동적 시스템 모델링 | 시계열 모델 생성, 추정, 예측 | System Identification Toolbox™
|
타임테이블 데이터를 사용한 시간 영역 시스템 식별 |
상태 모니터링과 예측 정비 | 센서 데이터를 분석하여 장비 고장을 예측하고 정비를 최적화하는 알고리즘 개발 | Predictive Maintenance Toolbox™
|
펌프 진단을 위한 특징 분석 및 선택 |
신호 분석 | 신호 필터링 및 분석, 시계열 데이터에서 특징 추출 |
|
흰긴수염고래의 노래에서 관심 영역 추출하기 |
딥러닝 | 신경망을 사용한 복잡한 패턴 포착 |
|
딥러닝을 사용한 시계열 예측 |
자료
문서, 예제, 비디오 등을 통해 여러분의 지식을 확장할 수 있습니다.
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다: United States
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
- América Latina (Español)
- Canada (English)
- United States (English)
유럽
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)