Statistical Methods in MATLAB
일정 보기 및 등록교육과정 세부 정보
본 교육과정에서는 실습 위주로 진행되며 MATLAB®과 Statistics and Machine Learning Toolbox™를 이용한 통계 데이터 분석 방법을 다룹니다. 다양한 예제와 연습문제를 통해 데이터 가져오기 및 구성, 탐색적 데이터 분석, 확증적 데이터 분석 및 시뮬레이션을 비롯하여 데이터 분석 프로세스 전반에 걸쳐 MATLAB과 Statistics and Machine Learning Toolbox의 기능들을 알아봅니다. 본 교육과정에서 다루는 주요 내용은 다음과 같습니다.
- 데이터 관리
- 요약 통계량 계산
- 데이터 시각화
- 분포 피팅(fitting)
- 유의성 검정 수행
- 분산 분석 수행
- 회귀 모델 피팅(fitting)
- 데이터셋의 차원 축소
- 난수 생성 및 시뮬레이션 수행
이 프로그램은 GARP에 의해 승인되었으며 GARP CPD 크레딧 14시간을 부여합니다. Certified FRM 또는 ERP를 보유한 경우에서 이 활동을 프로파일에 추가하시기 바랍니다.
1일차
데이터 가져오기 및 정리하기
학습목표: 데이터를 MATLAB으로 가져와서 분석을 위해 구성합니다. 데이터 병합, 누락된 데이터 처리 등 일반적인 작업을 수행합니다.
- 데이터 가져오기
- 데이터형
- table형 데이터
- 데이터 병합
- categorical형 데이터
- 누락된 데이터
데이터 탐색
학습목표: 기술 통계량의 계산 및 시각화를 비롯하여 데이터 세트의 기본 통계값을 조사합니다.
- 플로팅
- 중심 경향성
- 산포
- 모양
- 상관
- 그룹화된 데이터
분포
학습목표: 여러 확률 분포를 조사하고 분포를 데이터 세트에 피팅합니다. 난수를 사용하여 모델의 불확실성 또는 민감도를 평가하거나 시뮬레이션을 수행합니다. 여러 분포를 따르는 난수를 생성하고 MATLAB 난수 생성 알고리즘을 관리합니다.
- 확률 분포
- 분포 모수
- 분포 비교 및 피팅
- 비모수 피팅
- 부트스트랩 및 시뮬레이션
- 표준 분포에서 숫자 생성
- 임의 분포에서 숫자 생성
- 난수 스트림 제어
2일차
가설검정
학습목표: 데이터 세트에 대한 어설션 가능성의 정도를 결정합니다. 일반적인 사용하는 두 분포의 비교, 표본평균의 신뢰구간 결정 등에 가설 검정을 적용합니다.
- 가설검정
- 정규분포에 대한 검정
- 비정규분포에 대한 검정
분산분석
학습목표: 다수 그룹의 표본평균을 비교하고 그룹 간에 통계적으로 유의한지 찾아봅니다.
- 다중 비교
- 일원분산분석
- 다원분산분석
- 다변량분산분석
- 비정규분포 분산분석
- categorical형 상관
회귀
학습목표: 선형 및 비선형 모델을 데이터 세트에 피팅하여 예측 모델을 추정합니다. 모델 성능을 개선할 기법을 알아봅니다. 차원 수를 줄여서 고차원 데이터 세트를 단순화합니다.
- 선형 회귀 모델
- 데이터에 선형 모델 피팅
- 피팅 평가
- 모델 조정
- 로지스틱 및 일반화 선형 회귀
- 비선형 회귀
- 특징 변환
- 특징 선택