Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

dataset형 배열 변수의 데이터에 액세스하기

이 예제에서는 dataset형 배열 변수와 변수의 데이터를 사용하는 방법을 보여줍니다.

이름으로 변수에 액세스하기

변수(열) 이름과 점 인덱싱을 사용하여 변수 데이터에 액세스하거나 일부 변수를 선택할 수 있습니다. 샘플 dataset형 배열을 불러옵니다. hospital의 변수 이름을 표시합니다.

load hospital 
hospital.Properties.VarNames(:)
ans = 7x1 cell
    {'LastName'     }
    {'Sex'          }
    {'Age'          }
    {'Weight'       }
    {'Smoker'       }
    {'BloodPressure'}
    {'Trials'       }

이 dataset형 배열은 7개의 변수(열)와 100개의 관측값(행)을 가집니다. 작업 공간 창에서 hospital을 더블 클릭하여 변수 편집기에서 dataset형 배열을 볼 수 있습니다.

히스토그램 플로팅하기

변수 Weight에 포함된 데이터의 히스토그램을 플로팅합니다.

figure
histogram(hospital.Weight)

히스토그램을 통해 체중 분포가 이봉 분포임을 알 수 있습니다.

데이터를 범주별로 그룹화하여 플로팅하기

WeightSex의 값(Male, Female)으로 그룹화하여 상자 플롯을 그립니다. 즉, 변수 Sex를 그룹화 변수로 사용합니다.

figure
boxplot(hospital.Weight,hospital.Sex)

상자 플롯을 보면 체중이 이봉 분포인 이유가 성별로 설명된다는 것을 알 수 있습니다.

일부 변수 선택하기

변수 LastName, Sex, Weight만 있는 새 dataset형 배열을 만듭니다. 이름 또는 열 번호로 변수에 액세스할 수 있습니다.

ds1 = hospital(:,{'LastName','Sex','Weight'});
ds2 = hospital(:,[1,2,4]);

dataset형 배열 ds1ds2는 동일합니다. dataset형 배열을 인덱싱할 때 데이터형을 유지하려면, 즉 dataset형 배열의 일부를 선택하여 dataset형 배열을 만들려면 괄호 ( )를 사용하십시오. 변수 편집기에서 변수와 관측값의 일부를 선택하여 새 dataset형 배열을 만들 수도 있습니다.

변수 데이터형 변환하기

변수 Smoker의 데이터형을 논리형에서 레이블 NoYes를 사용하는 명목형으로 변환합니다.

hospital.Smoker = nominal(hospital.Smoker,{'No','Yes'});
class(hospital.Smoker)
ans = 
'nominal'

데이터 탐색하기

Smoker의 처음 10개 요소를 표시합니다.

hospital.Smoker(1:10)
ans = 10x1 nominal
     Yes 
     No 
     No 
     No 
     No 
     No 
     Yes 
     No 
     No 
     No 

명목형 배열의 수준 레이블을 변경하려면 setlabels를 사용하십시오.

변수 추가하기

변수 BloodPressure는 100×2 배열입니다. 첫 번째 열은 수축기 혈압에 해당하고, 두 번째 열은 확장기 혈압에 해당합니다. 이 배열을 두 개의 새 변수 SysPressureDiaPressure로 분리합니다.

hospital.SysPressure = hospital.BloodPressure(:,1);
hospital.DiaPressure = hospital.BloodPressure(:,2);
hospital.Properties.VarNames(:)
ans = 9x1 cell
    {'LastName'     }
    {'Sex'          }
    {'Age'          }
    {'Weight'       }
    {'Smoker'       }
    {'BloodPressure'}
    {'Trials'       }
    {'SysPressure'  }
    {'DiaPressure'  }

dataset형 배열 hospital에 두 개의 변수가 새로 추가되었습니다.

이름으로 변수 검색하기

regexp를 사용하여 hospital에서 이름에 'Pressure'가 포함된 변수를 찾습니다. 이러한 변수만 포함된 새 dataset형 배열을 만듭니다.

bp = regexp(hospital.Properties.VarNames,'Pressure');
bpIdx = cellfun(@isempty,bp);
bpData = hospital(:,~bpIdx);
bpData.Properties.VarNames(:)
ans = 3x1 cell
    {'BloodPressure'}
    {'SysPressure'  }
    {'DiaPressure'  }

새 dataset형 배열 bpData에는 혈압 변수만 포함되어 있습니다.

변수 삭제하기

dataset형 배열 hospital에서 변수 BloodPressure를 삭제합니다.

hospital.BloodPressure = [];
hospital.Properties.VarNames(:)
ans = 8x1 cell
    {'LastName'   }
    {'Sex'        }
    {'Age'        }
    {'Weight'     }
    {'Smoker'     }
    {'Trials'     }
    {'SysPressure'}
    {'DiaPressure'}

변수 BloodPressure가 dataset형 배열에 더 이상 없습니다.

참고 항목

관련 예제

세부 정보