andrewsplot

앤드류스(Andrews) 플롯

구문

andrewsplot(X)

andrewsplot(X,Name=Value)

andrewsplot(ax,___)

p = andrewsplot(___)

설명

andrewsplot(X)는 행렬 X의 다변량 데이터로부터 앤드류스 플롯을 만듭니다. 플롯은 X의 각 관측값에 대한 연속 곡선을 표시합니다. 자세한 내용은 앤드류스(Andrews) 플롯 항목을 참조하십시오.

andrewsplot(X,Name=Value)는 하나 이상의 이름-값 인수를 사용하여 추가 옵션을 지정합니다. 예를 들어 플로팅하기 전에 X의 데이터를 표준화하고 그룹화 변수를 사용하여 데이터를 그룹화할 수 있습니다.

예제

andrewsplot(ax,___)는 대상 좌표축 ax에 플롯을 표시합니다. 이 좌표축을 위에 열거된 구문에서 첫 번째 입력 인수로 지정합니다.

p = andrewsplot(___)은 위에 열거된 구문에 나와 있는 입력 인수 조합을 사용하여 Line 객체로 구성된 배열을 반환합니다. 플롯을 만든 후에 플롯의 속성을 수정하려면 p를 사용합니다. 속성 목록은 Line 속성 항목을 참조하십시오.

예제

모두 축소

그룹화된 데이터 시각화하기

라이브 스크립트 열기

그룹화된 표본 데이터를 시각화하기 위해 앤드류스 플롯을 만듭니다.

세 가지 붓꽃 종에 대한 4가지 측정값(꽃받침 길이, 꽃받침 너비, 꽃잎 길이, 꽃잎 너비)을 포함하는 fisheriris 데이터 세트를 불러옵니다.

load fisheriris

행렬 meas는 150개 꽃에 대한 4가지 측정값을 모두 포함합니다. 셀형 배열 species는 150개 꽃 각각에 대한 종 이름을 포함합니다.

표본 데이터를 species로 그룹화하여 앤드류스 플롯을 만듭니다.

andrewsplot(meas,Group=species)

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 150 objects of type line. These objects represent setosa, versicolor, virginica.

플롯은 각 관측값(꽃)을 구간 [0,1]에서 매끄러운 함수로 표시합니다. 각 곡선의 색은 꽃의 종을 나타냅니다.

각 그룹의 중앙값과 사분위수만 표시하는 단순화된 앤드류스 플롯을 하나 더 만듭니다.

andrewsplot(meas,Group=species,Quantile=0.25)

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 9 objects of type line. These objects represent setosa, versicolor, virginica.

이 플롯은 각 그룹의 중앙값을 실선 곡선으로 표시하고 그 밖의 사분위수 값을 동일한 색의 점선 곡선으로 표시합니다.

표준화와 사분위수를 사용하여 그룹 구별하기

라이브 스크립트 열기

앤드류스 플롯을 사용하여 다차원 데이터를 시각화합니다. 먼저 데이터를 그룹화합니다. 그런 다음 표준화와 사분위수를 사용하여 그룹 간의 차이를 확인합니다.

100명 환자에 대한 의료 정보를 포함하는 patients 데이터 세트를 불러옵니다. 1과 0 대신 설명적 범주 이름인 Smoker와 Nonsmoker를 지정합니다. 그런 다음 Diastolic 변수, Systolic 변수, Weight 변수, Age, Smoker 변수를 사용하여 테이블을 만듭니다.

load patients
Smoker = categorical(Smoker,logical([1 0]), ...
    ["Smoker","Nonsmoker"]);
patientData = table(Diastolic,Systolic,Weight,Age,Smoker);

patientData의 변수로부터 앤드류스 플롯을 만듭니다. 마지막 변수를 사용하여 흡연 상태에 따라 데이터를 그룹화합니다.

andrewsplot(patientData{:,1:end-1},Group=patientData.Smoker)

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 100 objects of type line. These objects represent Smoker, Nonsmoker.

기본적으로 플롯은 표준화되지 않은 데이터를 사용합니다. 이 플롯에서는 Smoker 그룹과 Nonsmoker 그룹 간에 큰 차이가 보이지 않습니다.

플로팅하기 전에 숫자형 patientData 변수를 표준화합니다.

andrewsplot(patientData{:,1:end-1},Group=Smoker,Standardize="on")

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 100 objects of type line. These objects represent Smoker, Nonsmoker.

이번에 생성된 앤드류스 플롯에서는 Smoker 그룹과 Nonsmoker 그룹 간에 변동이 더 크게 나타납니다. 이 플롯은 patientData의 매 환자마다 100개 곡선을 표시했기 때문에 다소 복잡합니다.

각 관측값마다 곡선을 하나씩 표시하는 대신에 각 그룹의 사분위수 곡선을 표시합니다. 사분위수는 25번째 백분위수, 중앙값, 75번째 백분위수로 구성됩니다.

andrewsplot(patientData{:,1:end-1},Group=patientData.Smoker, ...
    Standardize="on",Quantile=0.25)

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 6 objects of type line. These objects represent Smoker, Nonsmoker.

사분위수 곡선은 Smoker 그룹과 Nonsmoker 그룹 간의 차이를 보여줍니다. 예를 들어 약 0.25에서 두 그룹은 겹치지 않는 사분위수 값을 가지고 있습니다.

앤드류스 플롯에 표시되는 각 함수는 변수들의 선형 결합이며 해당 계수들은 시간이 지남에 따라 변한다는 점을 기억하십시오. (앤드류스(Andrews) 플롯 항목을 참조하십시오.) 시간 0.25에서의 변수에 대한 계수를 계산합니다. 이와 같은 변수들의 선형 결합은 그룹을 구별하는 데 도움이 될 수 있습니다.

t = 0.25;
variables = patientData.Properties.VariableNames(1:end-1)

variables = 1×4 cell
    {'Diastolic'}    {'Systolic'}    {'Weight'}    {'Age'}

coefficients = [1/sqrt(2) sin(2*pi*t) cos(2*pi*t) sin(4*pi*t)]

coefficients = 1×4

    0.7071    1.0000    0.0000    0.0000

시간 0.25에서, Diastolic 변수와 Systolic 변수는 비슷한 크기의 양의 계수를 가지고 있고 Weight 변수와 Age 변수는 0 계수를 가지고 있습니다. 위의 플롯은 데이터의 표준화 후에 Smoker 그룹의 사분위수 곡선은 시간 0.25에서 양의 값을 가지고 있고 Nonsmoker 그룹의 사분위수 곡선은 시간 0.25에서 음의 값을 가지고 있음을 보여줍니다.

이와 같은 플롯과 변수 계수는 Smoker 그룹의 환자들이 Diastolic 값과 Systolic 값이 더 높은 경향이 있음을 나타내며, 이는 patientData의 Smoker 그룹과 Nonsmoker 그룹을 구별하는 한 가지 방법을 제공합니다.

플롯 모양 조정하기

라이브 스크립트 열기

앤드류스 플롯의 모양을 조정합니다. andrewsplot 호출 시에 일부 플롯 속성을 설정할 수 있습니다. 또는 플롯을 만들기 전이나 만든 후에 모양을 지정할 수 있습니다.

세 가지 붓꽃 종에 대한 4가지 측정값(꽃받침 길이, 꽃받침 너비, 꽃잎 길이, 꽃잎 너비)을 포함하는 fisheriris 데이터 세트를 불러옵니다.

load fisheriris

행렬 meas는 150개 꽃에 대한 4가지 측정값을 모두 포함합니다. 셀형 배열 species는 150개 꽃 각각에 대한 종 이름을 포함합니다.

meas의 측정값 데이터와 species의 그룹 데이터를 사용하여 앤드류스 플롯을 만듭니다. 플로팅하기 전에 색 순서를 설정하여 그룹화된 데이터에 대해 디폴트가 아닌 색 체계(copper)를 지정합니다.

colororder(copper(3))
andrewsplot(meas,Group=species)

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 150 objects of type line. These objects represent setosa, versicolor, virginica.

species의 각 그룹에 대해 중앙값 곡선, 25번째 백분위수 곡선, 75번째 백분위수 곡선만 플로팅합니다. 플롯 선을 더 굵게 만들기 위해 선 너비를 2로 지정합니다. andrewsplot에 대한 호출에 LineWidth 값을 지정하면 이 함수는 플롯 내 모든 곡선의 선 너비를 동일한 값으로 설정합니다.

andrewsplot(meas,Group=species,Quantile=0.25,LineWidth=2)

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 9 objects of type line. These objects represent setosa, versicolor, virginica.

위의 플롯을 다시 만들되, 이번에는 setosa 그룹의 붓꽃에 대한 중앙값 측정값을 나타내는 곡선의 선 너비만 늘립니다. 먼저 Line 객체로 구성된 배열 p를 만듭니다. 여기서 각 객체는 플롯 내 하나의 곡선에 대응됩니다. 그런 다음 점 표기법을 사용하여 이 배열에 있는 첫 번째 Line 객체의 LineWidth 속성을 수정합니다.

p = andrewsplot(meas,Group=species,Quantile=0.25)

p = 
  9×1 Line array:

  Line    (median)
  Line    (lower quantile)
  Line    (upper quantile)
  Line    (median)
  Line    (lower quantile)
  Line    (upper quantile)
  Line    (median)
  Line    (lower quantile)
  Line    (upper quantile)

p(1).LineWidth = 2;

Figure contains an axes object. The axes object with xlabel t, ylabel f(t) contains 9 objects of type line. These objects represent setosa, versicolor, virginica.

입력 인수

모두 축소

`X` — 다변량 데이터
숫자형 행렬

다변량 데이터로, 숫자형 행렬로 지정됩니다. X의 행은 관측값에 대응되고 열은 변수에 대응됩니다.

andrewsplot은 X에 있는 NaN 값을 누락값으로 처리하여 해당 행을 무시합니다.

예: rand(100,10)

데이터형: single | double

`ax` — 플롯의 좌표축
`Axes` 객체

플롯의 좌표축으로, Axes 객체로 지정됩니다. ax를 지정하지 않으면 andrewsplot은 현재 좌표축을 사용하여 플롯을 만듭니다. Axes 객체를 생성하는 방법에 대한 자세한 내용은 axes를 참조하십시오.

이름-값 인수

모두 축소

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

예: andrewsplot(meas,Group=species,Quantile=0.25)는 species의 각 그룹에 대해 중앙값 곡선, 25번째 백분위수 곡선, 75번째 백분위수 곡선을 플로팅하도록 지정합니다.

`Group` — 데이터를 그룹화할 변수
숫자형 벡터 | 논리형 벡터 | 문자형 행렬 | string형 배열 | 문자형 벡터로 구성된 셀형 배열 | categorical형 벡터

데이터를 그룹화할 변수로, 숫자형 벡터, 논리형 벡터, 문자형 행렬, string형 배열, 문자형 벡터로 구성된 셀형 배열 또는 categorical형 벡터로 지정됩니다. X의 각 관측값에 그룹 값을 지정합니다.

andrewsplot 함수는 색을 사용하여 그룹을 구별합니다. 즉, 동일한 그룹의 관측값들은 동일한 색의 곡선을 가집니다. 기본적으로 andrewsplot은 최대 7가지 고유한 그룹 색을 할당합니다. 총 그룹 개수가 이 색 개수를 초과하면 함수는 색을 순환적으로 적용합니다. 앤드류스 플롯에서 특정 개수의 그룹에 대한 색을 조정하는 방법에 대한 예제는 플롯 모양 조정하기 항목을 참조하십시오.

예: Group=["good","bad","bad","good","good","bad","bad","bad"]

`Quantile` — 플로팅할 데이터의 분위수
(0,1) 범위의 숫자형 스칼라

플로팅할 데이터의 분위수로, (0,1) 범위의 숫자형 스칼라로 지정됩니다. Quantile을 값 α로 지정하면 andrewsplot 함수는 t의 각 값에서 f(t)의 중앙값, α, 1 – α 분위수만 플로팅합니다.

분위수 플롯 옵션은 X가 많은 관측값을 포함하고 있을 경우 데이터에 대한 유용한 요약을 제공합니다.

예: Quantile=0.25

데이터형: single | double

`Standardize` — 데이터 표준화 방법
`"off"` (디폴트 값) | `"on"` | `"pca"` | `"pcastd"`

데이터 표준화 방법으로, 다음 표에 나와 있는 값 중 하나로 지정됩니다.

값	설명
`"off"`	표준화되지 않은 `X` 데이터를 사용합니다.
`"on"`	플로팅하기 전에 중앙값은 0이고 표준편차는 1을 갖도록 `X`의 각 열을 스케일링합니다.
`"pca"`	고유값의 내림차순으로 `X`의 주성분 점수로부터 플롯을 만듭니다.
`"pcastd"`	표준화된 주성분 점수를 사용하여 플롯을 만듭니다.

주성분 분석에 대한 자세한 내용은 pca 항목을 참조하십시오.

예: Standardize="pca"

데이터형: char | string

출력 인수

모두 축소

`p` — 플롯 수정에 사용할 객체
`Line` 객체로 구성된 배열

플롯 수정에 사용할 객체로, Line 객체로 구성된 배열로 반환됩니다.

분위수 값(Quantile)을 지정하지 않으면 p는 X의 각 행에 대해 하나의 객체를 포함합니다.
분위수 값을 지정하면 p는 그룹화 변수(Group)의 각 그룹에 대해 3개의 객체를 포함합니다.

세부 정보

모두 축소

앤드류스(Andrews) 플롯

앤드류스 플롯은 구간 [0,1]에서 연속형 가변수 t의 함수 f(t)를 사용하여 관측값을 표시합니다. X의 관측값 i에 대해, 함수 f_i(t)는 다음과 같이 정의됩니다.

$f_{i} (t) = \frac{X (i, 1)}{\sqrt{2}} + X (i, 2) \cdot \sin (2 π t) + X (i, 3) \cdot \cos (2 π t) + X (i, 4) \cdot \sin (4 π t) + \dots$

팁

Line 속성에 나열된 속성에 대해 속성 이름과 값을 지정하여 플롯 곡선의 특성을 수정할 수 있습니다. 그러나 이 방법을 사용하면 수정 사항이 플롯 내 모든 곡선에 적용됩니다. 특정 플롯 곡선만 수정하려면 Line 객체를 반환하는 구문을 사용한 후에 점 표기법을 사용하여 각 객체 속성을 개별적으로 조정하십시오. 예제는 플롯 모양 조정하기 항목을 참조하십시오.

버전 내역

R2006a 이전에 개발됨

참고 항목

parallelcoords | glyphplot | pca

andrewsplot

구문

설명

예제

그룹화된 데이터 시각화하기

표준화와 사분위수를 사용하여 그룹 구별하기

플롯 모양 조정하기

입력 인수

X — 다변량 데이터 숫자형 행렬

ax — 플롯의 좌표축 Axes 객체

이름-값 인수

Group — 데이터를 그룹화할 변수 숫자형 벡터 | 논리형 벡터 | 문자형 행렬 | string형 배열 | 문자형 벡터로 구성된 셀형 배열 | categorical형 벡터

Quantile — 플로팅할 데이터의 분위수 (0,1) 범위의 숫자형 스칼라

Standardize — 데이터 표준화 방법 "off" (디폴트 값) | "on" | "pca" | "pcastd"

출력 인수

p — 플롯 수정에 사용할 객체 Line 객체로 구성된 배열

세부 정보

앤드류스(Andrews) 플롯

팁

버전 내역

참고 항목

도움말 항목

`X` — 다변량 데이터
숫자형 행렬

`ax` — 플롯의 좌표축
`Axes` 객체

`Group` — 데이터를 그룹화할 변수
숫자형 벡터 | 논리형 벡터 | 문자형 행렬 | string형 배열 | 문자형 벡터로 구성된 셀형 배열 | categorical형 벡터

`Quantile` — 플로팅할 데이터의 분위수
(0,1) 범위의 숫자형 스칼라

`Standardize` — 데이터 표준화 방법
`"off"` (디폴트 값) | `"on"` | `"pca"` | `"pcastd"`

`p` — 플롯 수정에 사용할 객체
`Line` 객체로 구성된 배열