Main Content

boxplot

상자 플롯으로 요약 통계량 시각화하기

설명

예제

boxplot(x)x의 데이터에 대한 상자 플롯을 생성합니다. x가 벡터인 경우, boxplot은 하나의 상자를 플로팅합니다. x가 행렬인 경우, boxplotx의 각 열에 대해 하나의 상자를 플로팅합니다.

각 상자마다 중앙에 있는 표시가 중앙값을 나타내고, 상자의 아래쪽 가장자리와 위쪽 가장자리는 각각 25번째 백분위수와 75번째 백분위수를 나타냅니다. 수염(Whisker)은 이상값으로 간주되지 않는 최대 또는 최소 데이터 점까지 확장되며, 이상값은 '+' 마커 기호를 사용하여 개별적으로 플로팅됩니다.

예제

boxplot(x,g)g에 포함된 하나 이상의 그룹화 변수를 사용하여 상자 플롯을 생성합니다. boxplot은 같은 g 값을 공유하는 x 값 세트마다 별도의 상자를 생성합니다.

boxplot(ax,___)는 위에 열거된 구문에 사용 시 axes 그래픽 객체 ax로 지정된 좌표축을 사용하여 상자 플롯을 생성합니다.

예제

boxplot(___,Name,Value)는 하나 이상의 Name,Value 쌍 인수를 추가 옵션으로 지정하여 상자 플롯을 생성합니다. 예를 들어, 상자 스타일이나 순서를 지정할 수 있습니다.

예제

모두 축소

표본 데이터를 불러옵니다.

load carsmall

갤런당 마일 주행 거리(MPG) 측정값에 대한 상자 플롯을 생성합니다. 제목을 추가하고 좌표축에 레이블을 지정합니다.

boxplot(MPG)
xlabel('All Vehicles')
ylabel('Miles per Gallon (MPG)')
title('Miles per Gallon for All Vehicles')

Figure contains an axes object. The axes object with title Miles per Gallon for All Vehicles, xlabel All Vehicles, ylabel Miles per Gallon (MPG) contains 7 objects of type line. One or more of the lines displays its values using only markers

이 상자 플롯은 표본 데이터에 포함된 모든 차량에 대한 갤런당 마일 주행거리의 중앙값이 대략 24임을 보여줍니다. 최솟값은 약 9이고, 최댓값은 약 44입니다.

표본 데이터를 불러옵니다.

load carsmall

표본 데이터의 갤런당 마일 주행거리(MPG) 측정값을 차량의 원산지(Origin)로 그룹화하여 보여주는 상자 플롯을 생성합니다. 제목을 추가하고 좌표축에 레이블을 지정합니다.

boxplot(MPG,Origin)
title('Miles per Gallon by Vehicle Origin')
xlabel('Country of Origin')
ylabel('Miles per Gallon (MPG)')

Figure contains an axes object. The axes object with title Miles per Gallon by Vehicle Origin, xlabel Country of Origin, ylabel Miles per Gallon (MPG) contains 42 objects of type line. One or more of the lines displays its values using only markers

각 상자는 특정 국가의 자동차에 대한 MPG 데이터를 시각적으로 나타냅니다. 이탈리아에 해당하는 "상자"는 표본 데이터에 이탈리아에 대한 관측값이 하나만 있으므로 단일 선으로 표시됩니다.

두 개의 표본 데이터 세트를 생성합니다. 첫 번째 표본 x1mu = 5이고 sigma = 1인 정규분포에서 생성된 난수를 포함합니다. 두 번째 표본 x2mu = 6이고 sigma = 1인 정규분포에서 생성된 난수를 포함합니다.

rng default  % For reproducibility
x1 = normrnd(5,1,100,1);
x2 = normrnd(6,1,100,1);

x1x2에 대한 노치가 있는 상자 플롯을 생성합니다. 각 상자에 이에 대응되는 mu 값으로 레이블을 지정합니다.

figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'})
title('Compare Random Data from Different Distributions')

Figure contains an axes object. The axes object with title Compare Random Data from Different Distributions contains 14 objects of type line. One or more of the lines displays its values using only markers

이 상자 플롯은 두 그룹의 중앙값 차이가 대략 1임을 보여줍니다. 상자 플롯에 표시된 노치가 겹치지 않기 때문에 95% 신뢰수준으로 실제 중앙값이 다르다고 결론을 내릴 수 있습니다.

다음 그림에서는 최대 수염(Whisker) 길이가 사분위 범위의 1.0배로 지정된 동일한 데이터에 대한 상자 플롯을 보여줍니다. 수염 외부에 있는 데이터 점은 +를 사용하여 표시됩니다.

figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'},'Whisker',1)
title('Compare Random Data from Different Distributions')

Figure contains an axes object. The axes object with title Compare Random Data from Different Distributions contains 14 objects of type line. One or more of the lines displays its values using only markers

수염이 작을수록 boxplot은 더 많은 데이터 점을 이상값으로 표시합니다.

표본 데이터로 사용하기 위해 표준 정규분포에서 생성된 난수로 구성된 100×25 행렬을 생성합니다.

rng default  % For reproducibility
x = randn(100,25);

동일한 Figure에 x의 데이터에 대한 상자 플롯 두 개를 생성합니다. 위쪽 플롯에는 디폴트 형식을 사용하고, 아래쪽 플롯에는 간소 형식을 사용합니다.

figure

subplot(2,1,1)
boxplot(x)

subplot(2,1,2)
boxplot(x,'PlotStyle','compact')

Figure contains 2 axes objects. Axes object 1 contains 175 objects of type line. Axes object 2 contains 150 objects of type line, text.

각 플롯은 동일한 데이터를 나타내지만, 상자가 많은 플롯의 경우 간소 형식이 가독성이 높을 수 있습니다.

그룹화 변수를 사용하여 서로 다른 길이의 데이터 벡터에 대한 상자 플롯을 생성합니다.

각각 길이가 5, 10, 15인 서로 다른 길이의 열 벡터 3개를 무작위로 생성합니다. 데이터를 길이가 30인 단일 열 벡터로 결합합니다.

rng('default')  % For reproducibility
x1 = rand(5,1);
x2 = rand(10,1);
x3 = rand(15,1);
x = [x1; x2; x3];

x 내의 각 벡터에 대응하는 행에 동일한 값을 할당하는 그룹화 변수를 만듭니다. 예를 들어, x의 처음 5개 행은 모두 동일한 벡터 x1에서 온 것이므로 g의 처음 5개 행은 동일한 값 First를 갖습니다.

g1 = repmat({'First'},5,1);
g2 = repmat({'Second'},10,1);
g3 = repmat({'Third'},15,1);
g = [g1; g2; g3];

상자 플롯을 생성합니다.

boxplot(x,g)

Figure contains an axes object. The axes object contains 21 objects of type line. One or more of the lines displays its values using only markers

입력 인수

모두 축소

입력 데이터로, 숫자형 벡터나 숫자형 행렬로 지정됩니다. x가 벡터인 경우, boxplot은 하나의 상자를 플로팅합니다. x가 행렬인 경우, boxplotx의 각 열에 대해 하나의 상자를 플로팅합니다.

각 상자마다 중앙에 있는 표시가 중앙값을 나타내고, 상자의 아래쪽 가장자리와 위쪽 가장자리는 각각 25번째 백분위수와 75번째 백분위수를 나타냅니다. 수염(Whisker)은 이상값으로 간주되지 않는 최대 또는 최소 데이터 점까지 확장되며, 이상값은 '+' 마커 기호를 사용하여 개별적으로 플로팅됩니다.

데이터형: single | double

그룹화 변수로, 숫자형 벡터, 문자형 배열, string형 배열, 셀형 배열 또는 categorical형 배열로 지정됩니다. 그룹화 변수 유형으로 구성된 셀형 배열이나 행렬을 사용하여 g에 여러 그룹화 변수를 지정할 수 있습니다. 여러 그룹화 변수를 지정하는 경우 길이가 모두 같아야 합니다.

x가 벡터인 경우 그룹화 변수는 x의 각 요소마다 하나의 행을 포함해야 합니다. x가 행렬인 경우 그룹화 변수는 x의 각 열마다 하나의 행을 포함해야 합니다. 그룹화 변수에 누락값(NaN), 빈 문자형 벡터, 비었거나 <missing>인 string형 또는 <undefined> 값이 포함되어 있는 그룹은 생략되고 다른 모수에서 고려하는 그룹 개수에 포함되지 않습니다.

기본적으로, boxplot은 데이터에 처음 나타나는 순서로 문자형 그룹화 변수와 string형 그룹화 변수를 정렬하고, categorical형 그룹화 변수는 해당 수준의 순서를 기준으로, 숫자형 그룹화 변수는 숫자순으로 정렬합니다. 그룹의 순서를 제어하려면 다음 작업 중 하나를 수행하십시오.

  • g에 범주형 변수를 사용하고 그 변수 수준의 순서를 지정합니다.

  • 'GroupOrder' 이름-값 쌍의 인수를 사용합니다.

  • 데이터를 미리 정렬해 둡니다.

데이터형: single | double | char | string | cell | categorical

플롯이 그려질 좌표축으로, axes 그래픽 객체로 지정됩니다. ax를 지정하지 않을 경우 boxplot은 현재 축을 사용하여 플롯을 생성합니다. axes 그래픽 객체를 생성하는 방법에 대한 자세한 내용은 axesAxes 속성를 참조하십시오.

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: 'Notch','on','Labels',{'mu = 5','mu = 6'}은 노치가 있는 상자 플롯을 생성하고 왼쪽에서 오른쪽으로 두 상자에 mu = 5mu = 6을 레이블로 지정합니다.

상자 모양

모두 축소

상자 스타일로, 다음 중 하나로 지정됩니다.

이름
'outline'파선 수염(Whisker)과 함께 채워지지 않은 상자를 사용하여 상자를 플로팅합니다. 이는 'PlotStyle''traditional'인 경우 디폴트 값입니다.
'filled'실선을 사용하여 수염을 나타내고 채워진 좁은 상자를 사용하여 상자를 플로팅합니다. 이는 'PlotStyle''compact'인 경우 디폴트 값입니다.

예: 'BoxStyle','filled'

상자 색으로, RGB 3색, 문자형 벡터 또는 string형 스칼라로 지정됩니다. RGB 3색은 요소를 3개 가진 행 벡터로, 요소는 각각 색을 구성하는 빨간색, 녹색, 파란색의 농도를 지정합니다. 각 농도의 범위는 [0,1]이어야 합니다.

다음 표에는 사용 가능한 색 문자와 이에 대응되는 RGB 3색 값이 정리되어 있습니다.

긴 이름짧은 이름RGB 3색
노란색'y'[1 1 0]
자홍색'm'[1 0 1]
녹청색'c'[0 1 1]
빨간색'r'[1 0 0]
녹색'g'[0 1 0]
파란색'b'[0 0 1]
흰색'w'[1 1 1]
검은색'k'[0 0 0]

색 이름을 나타내는 문자형 벡터 또는 string형 스칼라(예: 'rgbm') 또는 RGB 값으로 구성된 3열 행렬로 여러 색을 지정할 수 있습니다. 이 순서는 필요에 따라 복제하거나 자를 수 있습니다. 예를 들어, 'rb'는 빨간색과 파란색이 번갈아 나오는 상자를 제공합니다.

이름-값 쌍 'ColorGroup'을 지정하지 않으면 boxplot은 모든 상자에 동일한 색 체계를 사용합니다. 'ColorGroup'을 지정하지 않은 경우, 디폴트 값은 수정된 hsv colormap이 됩니다.

예: 'Colors','rgbm'

중앙값 스타일로, 다음 중 하나로 지정됩니다.

이름
'line'선을 그려 각 상자에서 중앙값을 나타냅니다. 이는 'PlotStyle''traditional'인 경우 디폴트 값입니다.
'target'흰색 원 내부에 검은색 점을 그려 각 상자에서 중앙값을 나타냅니다. 이는 'PlotStyle''compact'인 경우 디폴트 값입니다.

예: 'MedianStyle','target'

비교 구간을 나타내는 마커로, 다음 중 하나로 지정됩니다.

이름
'off'상자 표시에서 비교 구간을 생략합니다.
'on''PlotStyle''traditional'인 경우, 노치를 사용하여 비교 구간을 그립니다. 'PlotStyle''compact'인 경우, 삼각형 마커를 사용하여 비교 구간을 그립니다.
'marker'삼각형 마커를 사용하여 비교 구간을 그립니다.

두 중앙값은 구간이 겹치지 않는 경우 5% 유의수준에서 현저히 다릅니다. boxplot은 노치의 극값 또는 삼각형 마커의 중심을 사용하여 구간의 끝점을 나타냅니다. 노치 극값은 q2 – 1.57(q3 – q1)/sqrt(n)q2 + 1.57(q3 – q1)/sqrt(n)에 대응됩니다. 여기서 q2는 중앙값(50번째 백분위수)이고, q1q3은 각각 25번째 백분위수 및 75번째 백분위수이며, n은 NaN 값을 제외한 관측값 개수입니다. 표본 크기가 작은 경우, 노치가 상자 끝 너머까지 확장될 수 있습니다.

노치가 있는 상자 플롯에 레이블이 지정된 예제는 상자 플롯 항목을 참조하십시오.

예: 'Notch','on'

이상값에 대한 마커 크기로, 양의 숫자형 값으로 지정됩니다. 지정된 값은 마커 크기를 포인트 단위로 나타냅니다.

'PlotStyle''traditional'인 경우, OutlierSize의 디폴트 값은 6입니다. 'PlotStyle''compact'인 경우, OutlierSize의 디폴트 값은 4입니다.

예: 'OutlierSize',8

데이터형: single | double

플롯 스타일로, 다음 중 하나로 지정됩니다.

이름
'traditional'일반적인 상자 스타일을 사용하여 상자를 플로팅합니다.
'compact'더 작은 상자 스타일을 사용하여 상자를 플로팅합니다. 많은 그룹을 갖는 플롯에 사용하도록 설계되었습니다. 이 스타일은 일부 다른 모수에 대한 디폴트 값을 바꿉니다.

예: 'PlotStyle','compact'

이상값에 사용할 마커와 색으로, 마커와 색에 대한 기호를 포함하는 문자형 벡터 또는 string형 스칼라로 지정됩니다. 기호는 어떤 순서로든 표시될 수 있습니다. 마커 기호를 생략하면 이상값이 표시되지 않습니다. 색 기호를 생략하면 이상값이 상자와 같은 색으로 표시됩니다.

'PlotStyle''traditional'인 경우, 디폴트 값은 '+r'입니다. 이는 빨간색 플러스 기호 '+' 마커를 사용하여 각각의 이상값을 플로팅합니다.

'PlotStyle''compact'인 경우, 디폴트 값은 'o'입니다. 이는 해당하는 상자와 같은 색의 원 'o' 마커 기호를 사용하여 각각의 이상값을 플로팅합니다.

마커설명결과로 생성되는 마커
"o"

Sample of circle marker

"+"플러스 기호

Sample of plus sign marker

"*"별표

Sample of asterisk marker

"."

Sample of point marker

"x"십자

Sample of cross marker

"_"가로선

Sample of horizontal line marker

"|"세로선

Sample of vertical line marker

"square"정사각형

Sample of square marker

"diamond"다이아몬드

Sample of diamond marker

"^"위쪽 방향 삼각형

Sample of upward-pointing triangle marker

"v"아래쪽 방향 삼각형

Sample of downward-pointing triangle marker

">"오른쪽 방향 삼각형

Sample of right-pointing triangle marker

"<"왼쪽 방향 삼각형

Sample of left-pointing triangle marker

"pentagram"펜타그램

Sample of pentagram marker

"hexagram"헥사그램

Sample of hexagram marker

설명

'y'

노란색

'm'

자홍색

'c'

녹청색

'r'

빨간색

'g'

녹색

'b'

파란색

'w'

흰색

'k'

검은색

예: 이상값이 표시되지 않도록 하려면 'Symbol',''을 지정하십시오.

상자 너비로, 숫자형 스칼라 또는 숫자형 벡터로 지정됩니다. 상자 개수가 지정된 너비 값의 개수와 같지 않은 경우, 필요에 따라 값 목록이 복제되거나 잘립니다.

이 이름-값 쌍의 인수는 상자 간 간격을 바꾸지 않습니다. 따라서, 'Widths'에 대해 큰 값을 지정하면 상자가 겹칠 수 있습니다.

'Positions' 이름-값 쌍의 인수가 디폴트 값을 받는 경우 디폴트 상자 너비는 상자 간 최소 분리 간격의 절반인 0.5에 해당합니다.

예: 'Widths',0.3

데이터형: single | double

그룹 모양

모두 축소

상자 색 변경을 위한 그룹화 변수로, 그룹화 변수로 지정됩니다. 그룹화 변수는 숫자형 벡터, 문자형 배열, string형 배열, 셀형 배열 또는 categorical형 배열입니다. 지정된 그룹화 변수가 변경되면 상자 색도 변경됩니다. 디폴트 값 []은 상자 색이 그룹에 따라 변경되지 않는다는 것을 나타냅니다.

데이터형: single | double | char | string | cell | categorical

플롯의 인자 순서로, 다음 중 하나로 지정됩니다.

이름
'data'인자가 플롯 원점 옆의 첫 번째 값과 함께 표시됩니다.
'list'인자가 x 축에 있는 경우 왼쪽에서 오른쪽으로 표시되고, y 축에 있는 경우 위쪽에서 아래쪽으로 표시됩니다.
'auto'그룹화 변수가 숫자형인 경우, boxplot'data'를 사용합니다. 그룹화 변수가 문자형 배열, string형 배열, 셀형 배열 또는 categorical형 배열인 경우, boxplot'list'를 사용합니다.

예: 'FactorDirection','auto'

모든 그룹 인자 플로팅으로, 'off''on'으로 지정됩니다. 'off'인 경우, boxplot은 그룹화 변수의 각 고유 행에 대해 하나의 상자를 플로팅합니다. 'on'인 경우, boxplot은 데이터에 나타나지 않는 조합을 포함하여 그룹화 변수 값의 가능한 조합 각각에 대해 하나의 상자를 플로팅합니다.

예: 'FullFactors','on'

서로 다른 그룹화 인자 간 거리로, 양의 숫자형 값, 양의 숫자형 값으로 구성된 벡터 또는 'auto'로 지정됩니다. 벡터를 지정하는 경우, 벡터 길이는 그룹화 변수의 개수보다 작거나 같아야 합니다.

'FactorGap'은 그룹화 변수의 서로 다른 인자 간 간격의 거리를 나타내며, 플롯의 너비에 대한 백분율로 표현됩니다. 예를 들어, [3,1]을 지정한 경우, 첫 번째 그룹화 변수의 값이 다른 그룹 간에는 플롯 너비의 3%에 해당하는 간격을 두고, 첫 번째 그룹화 변수의 값은 같지만 두 번째 그룹화 변수의 값이 다른 그룹 간에는 플롯 너비의 1%에 해당하는 간격을 둡니다.

'auto'를 지정하면 boxplot이 간격 거리를 자동으로 선택합니다. 값 []은 서로 다른 인자 간 간격 크기의 변화가 없음을 나타냅니다.

'PlotStyle''traditional'인 경우, FactorGap의 디폴트 값은 []입니다. 'PlotStyle''compact'인 경우, 디폴트 값은 'auto'입니다.

예: 'FactorGap',[3,1]

데이터형: single | double | char | string

그룹화 인자 간 분리로, 양의 정수, 양의 정수로 구성된 벡터 또는 'auto'로 지정됩니다. 벡터를 지정하는 경우, 벡터의 길이는 그룹화 변수의 개수보다 작거나 같아야 합니다. 정수 값의 범위는 [1,G]이어야 하며, 여기서 G는 그룹화 변수의 개수입니다.

'FactorSeparator'는 그리드 선으로 구분되는 값을 가져야 하는 인자를 지정합니다. 예를 들어, [1,2]는 첫 번째 그룹화 변수나 두 번째 그룹화 변수가 값을 변경하는 경우 구분선을 추가합니다.

'PlotStyle''traditional'인 경우, FactorSeparator의 디폴트 값은 []입니다. 'PlotStyle''compact'인 경우, 디폴트 값은 'auto'입니다.

예: 'FactorSeparator',[1,2]

데이터형: single | double | char | string

그룹의 플로팅 순서로, 그룹화 변수의 이름을 포함하는 string형 배열 또는 셀형 배열로 지정됩니다. 여러 그룹화 변수를 사용하는 경우 쉼표로 값을 구분하십시오. 그룹화 변수로 categorical형 배열을 사용하여 상자의 순서를 제어할 수도 있습니다. 디폴트 값 []은 상자를 재정렬하지 않습니다.

데이터형: string | cell

데이터 제한과 최대 거리

모두 축소

극 데이터 제한으로, 각각 하한과 상한을 나타내는, 요소를 2개 가진 숫자형 벡터로 지정됩니다. 'DataLim'에 지정되는 값은 'ExtremeMode'에서 극값을 가지는 데이터 점을 확인하는 데 사용됩니다.

데이터형: single | double

극 데이터 처리 방법으로, 다음 중 하나로 지정됩니다.

이름
'clip''DataLim'으로 지정된 제한을 벗어나는 데이터 값이 있는 경우, boxplot은 플롯에서 DataLim 지점에 이러한 값을 표시합니다.
'compress''DataLim'으로 지정된 제한을 벗어나는 데이터 값이 있는 경우, boxplotDataLim을 바로 벗어난 영역에 이러한 값을 균등 분포하여 표시함으로써 이러한 점의 상대적인 순서를 유지합니다.

'DataLim'으로 지정된 제한을 벗어나는 데이터 점이 있는 경우, 이 제한은 점선으로 표시됩니다. 데이터 점이 압축된 경우, 두 개의 회색 선으로 압축 영역이 표시됩니다. –Inf 또는 Inf의 값은 잘리거나 압축될 수 있지만, NaN 값은 플롯에 표시되지 않습니다. 중앙값이 제한 내에 있는 경우 상자의 홈(노치)이 일정한 규모로 그려지며 상한 또는 하한을 벗어날 수 있습니다. 중앙값이 제한 외부에 있는 경우에는 상자의 홈이 그려지지 않습니다.

예: 'ExtremeMode','compress'

최대 이상값 변위 거리로, 숫자형 값으로 지정됩니다. Jitter는 중복된 점이 표시되도록 하기 위해 균일한 임의 크기로 인자 축을 따라 이상값을 변위시키는 최대 거리입니다. 'Jitter'를 1로 지정하면 지터 영역이 가장 근접한 인접 그룹 사이에 딱 맞게 됩니다.

'PlotStyle''traditional'인 경우, Jitter의 디폴트 값은 0입니다. 'PlotStyle''compact'인 경우, 디폴트 값은 0.5입니다.

예: 'Jitter',1

데이터형: single | double

최대 수염 길이 승수로, 양의 숫자형 값으로 지정됩니다. 최대 수염 길이는 Whisker와 사분위 범위의 곱입니다.

boxplotq3 + w × (q3 – q1)보다 크거나 q1 – w × (q3 – q1)보다 작은 점을 이상값으로 그립니다. 여기서 w는 승수 Whisker이고 q1 및 q3은 각각 표본 데이터에 대한 25번째 백분위수와 75번째 백분위수입니다.

데이터가 정규분포된 경우 'Whisker'의 디폴트 값은 대략적으로 +/–2.7σ이고 99.3% 범위에 해당됩니다. 플로팅된 수염은 이상값이 아니라 최대 또는 최소 데이터 값인 인접 값까지 확장됩니다.

수염을 그리지 않고 q1 및 q3 외부에 있는 모든 점을 이상값으로 만들려면 'Whisker'를 0으로 지정하십시오.

수염이 있는 상자 플롯에 레이블이 지정된 예제는 상자 플롯 항목을 참조하십시오.

예: 'Whisker',0

데이터형: single | double

플롯 모양

모두 축소

상자 레이블로, 상자 레이블 이름을 포함하는 문자형 배열, string형 배열, 셀형 배열 또는 숫자형 벡터로 지정됩니다. x 값 하나당 하나의 레이블을 지정하거나 그룹당 하나의 레이블을 지정합니다. 여러 레이블 변수를 지정하려면 숫자형 행렬 또는 허용되는 데이터형을 포함하는 셀형 배열을 사용하십시오.

플롯에서 레이블을 제거하려면 다음 명령을 사용하십시오. set(gca,'XTickLabel',{' '})

데이터형: char | string | cell | single | double

레이블 방향으로, 다음 중 하나로 지정됩니다.

이름
'inline'상자 레이블이 세로가 되도록 회전합니다. 이는 'PlotStyle''compact'인 경우 디폴트 값입니다.
'horizontal'상자 레이블을 가로로 유지합니다. 이는 'PlotStyle''traditional'인 경우 디폴트 값입니다.

레이블이 y 축에 있는 경우 두 설정 모두 레이블을 가로로 유지합니다.

예: 'LabelOrientation','inline'

플롯에 표시할 레이블로, 다음 중 하나로 지정됩니다.

이름
'all'그룹화 변수의 모든 값에 대한 레이블을 표시합니다. 이는 'PlotStyle''traditional'인 경우 디폴트 값입니다.
'minor'

그룹화 변수의 경우, 상자 j에 대응되는 값은 상자 (j – 1)에 대응되는 값과 다른 경우에만 표시됩니다.

'majorminor'

그룹화 변수 g(:,i)의 경우, 상자 j에 대응되는 값은 상자 (j – 1)에 대응되는 g(:,i)의 값과 다른 경우 표시됩니다. 또는, 그룹화 변수 g(:,1),…,g(:,i-1) 중 적어도 하나 이상에 대해 위 조건이 성립되는 경우 표시됩니다. 이는 'PlotStyle''compact'인 경우 디폴트 값입니다.

예: 'LabelVerbosity','minor'

플롯 방향으로, 다음 중 하나로 지정됩니다.

이름
'vertical'y 축에 x를 플로팅합니다.
'horizontal'x 축에 x를 플로팅합니다.

예: 'Orientation','horizontal'

상자 위치로, 각 그룹에 대해 하나의 요소(또는 x 값)를 갖는 숫자형 벡터로 지정됩니다. 디폴트 값은 1:NumGroups이며, 여기서 NumGroups는 그룹 개수입니다.

데이터형: single | double

세부 정보

모두 축소

상자 플롯

상자 플롯은 표본 데이터의 요약 통계량에 대한 시각화를 제공하며 다음과 같은 특징을 포함하고 있습니다.

  • 각 상자의 맨 아래와 맨 위는 각각 표본의 25번째 백분위수와 75번째 백분위수입니다. 각 상자의 맨 아래와 맨 위 사이의 거리는 사분위 범위입니다.

  • 각 상자의 중간에 있는 빨간색 선은 표본 중앙값입니다. 중앙값이 상자의 중심에 있지 않을 경우, 플롯은 표본 왜도를 보여줍니다.

  • 수염은 각 상자 위와 아래로 확장되는 선입니다. 수염은 사분위 범위의 끝에서 수염 길이 내의 가장 먼 관측값까지 확장됩니다(인접 값).

  • 수염 길이를 초과하는 관측값은 이상값으로 표시됩니다. 기본적으로 이상값은 상자의 맨 아래 또는 맨 위에서 사분위 범위의 1.5배 이상 떨어져 있는 값입니다. 그러나 추가적인 입력 인수를 사용하여 이 값을 조정할 수 있습니다. 이상값은 빨간색 + 기호로 표시됩니다.

  • 노치는 표본 사이의 중앙값의 변동성을 표시합니다. 노치가 겹치지 않는 상자가 5% 유의수준에서 서로 다른 중앙값을 가지도록 노치의 너비가 계산됩니다. 유의수준은 정규분포 가정을 기반으로 하지만, 중앙값 비교는 다른 분포에 대해서 상당히 견고합니다. 상자 플롯 중앙값의 비교는 가설검정의 시각화와 같으며 평균에 사용되는 t 검정과 유사합니다. 경우에 따라 노치가 상자 외부로 확장될 수 있습니다.

Example of a box plot with labels for the summary statistics

  • boxplot은 데이터를 시각적으로 표현하지만, 숫자형 값을 반환하지는 않습니다. 표본 데이터 관련 요약 통계량을 계산하려면 다음 함수를 사용하십시오.

    • min — 표본 데이터에서 최솟값을 구합니다.

    • max — 표본 데이터에서 최댓값을 구합니다.

    • median — 표본 데이터에서 중앙값을 구합니다.

    • quantile — 표본 데이터에서 분위수 값을 구합니다. 예를 들어, x의 25번째 백분위수와 75번째 백분위수를 계산하려면 quantile(x,[0.25 0.75])를 지정하십시오.

    • iqr — 표본 데이터에서 사분위 범위를 구합니다.

    • grpstats — 표본 데이터의 요약 통계량을 그룹별로 재구성하여 계산합니다.

  • Figure 창에서 데이터 커서를 사용하여 데이터 값과 그룹 이름을 볼 수 있습니다. 데이터 커서는 datalim 모수의 영향을 받는 모든 점의 원래 값을 표시합니다. gname 함수를 사용하여 이상값이 속해 있는 그룹에 레이블을 지정할 수 있습니다.

  • 상자 플롯 성분의 그래픽스 속성을 수정하려면 findobjTag 속성과 함께 사용하여 성분의 핸들을 찾으십시오. 상자 플롯 성분의 Tag 값은 모수 설정에 따라 다르며, 다음 표에 정리되어 있습니다.

    모수 설정태그 값
    모든 설정
    • 'Box'

    • 'Outliers'

    'PlotStyle''traditional'인 경우
    • 'Median'

    • 'Upper Whisker'

    • 'Lower Whisker'

    • 'Upper Adjacent Value'

    • 'Lower Adjacent Value'

    'PlotStyle''compact'인 경우
    • 'Whisker'

    • 'MedianOuter'

    • 'MedianInner'

    'Notch''marker'인 경우
    • 'NotchLo'

    • 'NotchHi'

대체 기능

또한 boxchart 함수를 사용하여 BoxChart 객체를 만들 수도 있습니다. boxchartboxplot의 모든 기능을 포함하지는 않지만, 몇 가지 이점을 가집니다. boxplot과는 달리, boxchart 함수의 특징은 다음과 같습니다.

  • 그룹 축을 따라 categorical형 눈금자를 사용할 수 있음

  • 범례 옵션을 제공함

  • hold on 명령을 사용할 경우 상당히 효과적임

  • 시각적 설계가 개선되어 노치를 보다 쉽게 볼 수 있음

객체의 모양과 동작을 제어하려면 BoxChart Properties를 변경하십시오.

참고 문헌

[1] McGill, R., J. W. Tukey, and W. A. Larsen. “Variations of Boxplots.” The American Statistician. Vol. 32, No. 1, 1978, pp. 12–16.

[2] Velleman, P.F., and D.C. Hoaglin. Applications, Basics, and Computing of Exploratory Data Analysis. Pacific Grove, CA: Duxbury Press, 1981.

[3] Nelson, L. S. “Evaluating Overlapping Confidence Intervals.” Journal of Quality Technology. Vol. 21, 1989, pp. 140–141.

[4] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006.

버전 내역

R2006a 이전에 개발됨