excludedata
피팅에서 데이터 제외
구문
설명
예제
제외 규칙 시각화하기
임의의 데이터를 사용해 제외 규칙을 시각화합니다.
임의의 x
및 y
데이터를 생성합니다.
xdata = -3 + 6*rand(1,1e4); ydata = -3 + 6*rand(1,1e4);
일례로, 상자 [-1 1 -1 1]
안에 있거나 정의역 [-2 2]
밖에 있는 데이터는 제외합니다.
outliers1 = ~excludedata(xdata,ydata,'box',[-1 1 -1 1]); outliers2 = excludedata(xdata,ydata,'domain',[-2 2]); outliers = outliers1|outliers2;
제외되지 않은 데이터를 플로팅합니다. 흰색 영역은 제외된 영역에 해당합니다.
plot(xdata(~outliers),ydata(~outliers),'.') axis([-3 3 -3 3]) axis square
곡선 피팅에서 데이터 제외하기
2000년도 미국 대통령 선거에서 플로리다주의 투표수와 카운티 이름을 불러옵니다.
load flvote2k
두 주요 정당 후보인 부시와 고어의 투표수를 사용하고 제3의 후보인 뷰캐넌의 투표수는 예측 변수로 사용하여 산점도를 플로팅합니다.
plot(bush,buchanan,'rs') hold on plot(gore,buchanan,'bo') legend('Bush data','Gore data')
부시나 고어에게 가야 할 표 중 고정된 일정 비율이 뷰캐넌에게 가는 모델을 가정합니다.
f = fittype({'x'})
f = Linear model: f(a,x) = a*x
논란이 많은 “나비 모양” 투표용지를 사용하지 않았던 부재 투표자의 데이터는 제외합니다.
nobutterfly = strcmp(counties,'Absentee Ballots');
부재자 투표를 제외한 두 데이터 세트에 대해 이 모델의 겹제곱 가중치 로버스트 피팅을 수행합니다.
bushfit = fit(bush,buchanan,f,'Exclude',nobutterfly,'Robust','on'); gorefit = fit(gore,buchanan,f,'Exclude',nobutterfly,'Robust','on');
로버스트 피팅에서는 이상값에 낮은 가중치가 주어지므로, 로버스트 피팅의 큰 잔차를 사용해 이상값을 식별할 수 있습니다.
figure plot(bushfit,bush,buchanan,'rs','residuals') hold on plot(gorefit,gore,buchanan,'bo','residuals')
잔차를 계산합니다.
bushres = buchanan - feval(bushfit,bush); goreres = buchanan - feval(gorefit,gore);
큰 잔차를 치역 [-500 500] 밖에 있는 것으로 식별합니다.
bushoutliers = excludedata(bush,bushres,'range',[-500 500]); goreoutliers = excludedata(gore,goreres,'range',[-500 500]);
이상값에 해당하는 카운티를 표시합니다. 마이애미데이드 카운티와 브라우어드 카운티가 가장 큰 예측 변수 값에 대응됩니다. 플로리다주에서 “나비 모양” 투표용지를 사용한 유일한 카운티인 팜비치 카운티가 가장 큰 잔차 값에 대응됩니다.
counties(bushoutliers)
ans = 2x1 cell
{'Miami-Dade'}
{'Palm Beach'}
counties(goreoutliers)
ans = 3x1 cell
{'Broward' }
{'Miami-Dade'}
{'Palm Beach'}
입력 인수
x
— 데이터 지점
숫자형 벡터
데이터 값의 데이터 지점으로, 숫자형 벡터로 지정됩니다.
y
— 데이터 값
숫자형 벡터
데이터 값으로, 숫자형 벡터로 지정됩니다.
box
— 밖에 있는 데이터를 찾기 위한 상자
4개의 요소를 가진 숫자형 벡터
밖에 있는 데이터를 찾기 위한 상자로, 4개의 요소를 가진 숫자형 벡터 [xmin xmax ymin ymax]
로 지정됩니다.
예: [-1 1 0 2]
domain
— 밖에 있는 데이터를 찾기 위한 정의역
2개의 요소를 가진 숫자형 벡터
밖에 있는 데이터를 찾기 위한 정의역으로, 2개의 요소를 가진 숫자형 벡터 [xmin xmax]
로 지정됩니다.
예: [-1 1]
range
— 밖에 있는 데이터를 찾기 위한 치역
2개의 요소를 가진 숫자형 벡터
밖에 있는 데이터를 찾기 위한 치역으로, 2개의 요소를 가진 숫자형 벡터 [ymin ymax]
로 지정됩니다.
예: [3 4]
indices
— 찾을 데이터 점의 인덱스
숫자형 벡터
찾을 데이터 점의 인덱스로, 숫자형 벡터로 지정됩니다.
예: [3 7 9]
버전 내역
R2006a 이전에 개발됨
참고 항목
MATLAB 명령
다음 MATLAB 명령에 해당하는 링크를 클릭했습니다.
명령을 실행하려면 MATLAB 명령 창에 입력하십시오. 웹 브라우저는 MATLAB 명령을 지원하지 않습니다.
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)