Main Content

dataset 클래스

(권장되지 않음) 통계 데이터용 배열

dataset 데이터형은 권장되지 않습니다. 이종 데이터를 사용하려면 MATLAB® table 데이터형을 대신 사용하십시오. 자세한 내용은 MATLAB table 문서를 참조하십시오.

설명

dataset형 배열은 이종 데이터와 메타데이터(변수 이름과 관측값 이름 포함)를 단일 컨테이너 변수로 수집하는 데 사용됩니다. dataset형 배열은 대개 텍스트 파일 또는 스프레드시트에 열로 저장되는 열 방향 데이터나 테이블 형식 데이터를 저장하는 데 적합하며 다양한 유형, 크기, 단위 등의 변수를 수용할 수 있습니다.

dataset형 배열은 숫자형, 논리형, 문자형, string형, categorical형, 셀형 등 다양한 종류의 변수를 포함할 수 있습니다. 하지만 dataset형 배열은 배열에 포함되는 변수와는 다른 클래스입니다. 예를 들어, double형 배열인 변수만 포함하는 dataset형 배열일지라도 그 자체가 double형 배열인 것처럼 연산을 수행할 수 없습니다. 하지만 점 첨자를 사용하여 dataset형 배열의 변수에 대해 작업 공간 변수인 것처럼 연산을 수행할 수 있습니다.

일반적인 숫자형 배열처럼 괄호를 사용하여 dataset형 배열을 첨자로 설정할 수 있을 뿐만 아니라 숫자형 인덱스와 논리형 인덱스 외에 변수 이름과 관측값 이름을 인덱스로 사용할 수 있습니다.

생성

dataset 생성자를 사용하여 MATLAB 작업 공간의 변수에서 dataset형 배열을 만듭니다. 또한 텍스트 파일 또는 스프레드시트 파일의 데이터를 읽어와서 dataset형 배열을 만들 수도 있습니다. 점 첨자를 사용하여 구조체의 필드처럼 dataset형 배열의 각 변수에 액세스할 수 있습니다. dataset형 배열에 사용 가능한 연산 목록은 다음 섹션을 참조하십시오.

dataset(Not Recommended) Construct dataset array

방법

cat(Not Recommended) Concatenate dataset arrays
cellstr(Not Recommended) Create cell array of character vectors from dataset array
dataset2cell(Not Recommended) Convert dataset array to cell array
dataset2struct(Not Recommended) Convert dataset array to structure
datasetfun(Not Recommended) Apply function to dataset array variables
disp(Not Recommended) Display dataset array
display(권장되지 않음) dataset형 배열 표시
double(Not Recommended) Convert dataset variables to double array
end(Not Recommended) Last index in indexing expression for dataset array
export(Not Recommended) Write dataset array to file
get(Not Recommended) Access dataset array properties
horzcat(Not Recommended) Horizontal concatenation for dataset arrays
intersect(Not Recommended) Set intersection for dataset array observations
isempty(Not Recommended) True for empty dataset array
ismember(Not Recommended) Dataset array elements that are members of set
ismissing(Not Recommended) Find dataset array elements with missing values
join(Not Recommended) Merge dataset array observations
length(Not Recommended) Length of dataset array
ndims(Not Recommended) Number of dimensions of dataset array
numel(Not Recommended) Number of elements in dataset array
replaceWithMissing(Not Recommended) Insert missing data indicators into a dataset array
replacedata(Not Recommended) Replace dataset variables
set(Not Recommended) Set and display dataset array properties
setdiff(Not Recommended) Set difference for dataset array observations
setxor(Not Recommended) Set exclusive or for dataset array observations
single(Not Recommended) Convert dataset variables to single array
size(Not Recommended) Size of dataset array
sortrows(Not Recommended) Sort rows of dataset array
stack(Not Recommended) Stack dataset array from multiple variables into single variable
subsasgn(Not Recommended) Subscripted assignment to dataset array
subsref(Not Recommended) Subscripted reference for dataset array
summary(Not Recommended) Print summary of dataset array
union(Not Recommended) Set union for dataset array observations
unique(Not Recommended) Unique observations in dataset array
unstack(Not Recommended) Unstack dataset array from single variable into multiple variables
vertcat(Not Recommended) Vertical concatenation for dataset arrays

속성

dataset형 배열 D는 메타데이터(데이터에 대한 정보)를 저장하는 속성을 가집니다. P = D.Properties.PropName 또는 D.Properties.PropName = P를 사용하여 속성에 액세스하거나 할당합니다. 여기서 PropName은 다음 중 하나입니다.

Description

Description은 dataset형 배열을 설명하는 문자형 벡터입니다. 디폴트 값은 빈 문자형 벡터입니다.

DimNames

dataset형 배열의 두 차원의 이름을 지정하는 문자형 벡터로 구성된 2개의 요소를 가진 셀형 배열입니다. 디폴트 값은 {'Observations' 'Variables'}입니다.

ObsNames

비어 있지 않은 셀형 배열로, dataset형 배열의 관측값의 이름을 지정하는 고유한 문자형 벡터입니다. 이 속성은 비어 있을 수 있습니다. 하지만 비어 있지 않은 경우 문자형 벡터의 개수는 관측값의 개수와 같아야 합니다.

Units

dataset형 배열의 변수의 단위를 지정하는 문자형 벡터로 구성된 셀형 배열입니다. 이 속성은 비어 있을 수 있습니다. 하지만 비어 있지 않은 경우 문자형 벡터의 개수는 변수의 개수와 같아야 합니다. 정의된 단위가 없는 변수의 경우 개별 문자형 벡터가 비어 있을 수 있습니다. 디폴트 값은 빈 셀형 배열입니다.

UserData

dataset형 배열과 연결될 추가 정보를 포함하는 변수입니다. 디폴트 값은 빈 배열입니다.

VarDescription

dataset형 배열의 변수에 대한 설명을 지정하는 문자형 벡터로 구성된 셀형 배열입니다. 이 속성은 비어 있을 수 있습니다. 하지만 비어 있지 않은 경우 문자형 벡터의 개수는 변수의 개수와 같아야 합니다. 정의된 설명이 없는 변수의 경우 개별 문자형 벡터가 비어 있을 수 있습니다. 디폴트 값은 빈 셀형 배열입니다.

VarNames

비어 있지 않은 셀형 배열로, dataset형 배열의 변수의 이름을 지정하는 고유한 문자형 벡터입니다. 문자형 벡터의 개수는 변수의 개수와 같아야 합니다. 디폴트 값은 데이터 세트를 만드는 데 사용되는 변수의 이름으로 구성된 셀형 배열입니다.

복사 의미 체계

값입니다. 복사 의미 체계가 클래스에 영향을 미치는 방식을 알아보려면 MATLAB 객체 지향 프로그래밍 설명서의 핸들 클래스와 값 클래스 비교를 참조하십시오.

예제

.mat 파일에서 dataset형 배열을 불러오고 다음과 같은 간단한 서브셋을 만듭니다.

load hospital
h1 = hospital(1:10,:)
h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'})

% Access and modify metadata
hospital.Properties.Description
hospital.Properties.VarNames{4} = 'Wgt'

% Create a new dataset variable from an existing one
hospital.AtRisk = hospital.Smoker | (hospital.Age > 40)

% Use individual variables to explore the data
boxplot(hospital.Age,hospital.Sex)
h3 = hospital(hospital.Age<30,...
   {'LastName' 'Age' 'Sex' 'Smoker'})

% Sort the observations based on two variables
h4 = sortrows(hospital,{'Sex','Age'})

참고 항목

| |