dataset 클래스
(권장되지 않음) 통계 데이터용 배열
dataset
데이터형은 권장되지 않습니다. 이종 데이터를 사용하려면 MATLAB® table
데이터형을 대신 사용하십시오. 자세한 내용은 MATLAB table
문서를 참조하십시오.
설명
dataset형 배열은 이종 데이터와 메타데이터(변수 이름과 관측값 이름 포함)를 단일 컨테이너 변수로 수집하는 데 사용됩니다. dataset형 배열은 대개 텍스트 파일 또는 스프레드시트에 열로 저장되는 열 방향 데이터나 테이블 형식 데이터를 저장하는 데 적합하며 다양한 유형, 크기, 단위 등의 변수를 수용할 수 있습니다.
dataset형 배열은 숫자형, 논리형, 문자형, string형, categorical형, 셀형 등 다양한 종류의 변수를 포함할 수 있습니다. 하지만 dataset형 배열은 배열에 포함되는 변수와는 다른 클래스입니다. 예를 들어, double형 배열인 변수만 포함하는 dataset형 배열일지라도 그 자체가 double형 배열인 것처럼 연산을 수행할 수 없습니다. 하지만 점 첨자를 사용하여 dataset형 배열의 변수에 대해 작업 공간 변수인 것처럼 연산을 수행할 수 있습니다.
일반적인 숫자형 배열처럼 괄호를 사용하여 dataset형 배열을 첨자로 설정할 수 있을 뿐만 아니라 숫자형 인덱스와 논리형 인덱스 외에 변수 이름과 관측값 이름을 인덱스로 사용할 수 있습니다.
생성
dataset
생성자를 사용하여 MATLAB 작업 공간의 변수에서 dataset형 배열을 만듭니다. 또한 텍스트 파일 또는 스프레드시트 파일의 데이터를 읽어와서 dataset형 배열을 만들 수도 있습니다. 점 첨자를 사용하여 구조체의 필드처럼 dataset형 배열의 각 변수에 액세스할 수 있습니다. dataset형 배열에 사용 가능한 연산 목록은 다음 섹션을 참조하십시오.
dataset | (Not Recommended) Construct dataset array |
방법
cat | (Not Recommended) Concatenate dataset arrays |
cellstr | (Not Recommended) Create cell array of character vectors from dataset array |
dataset2cell | (Not Recommended) Convert dataset array to cell array |
dataset2struct | (Not Recommended) Convert dataset array to structure |
datasetfun | (Not Recommended) Apply function to dataset array variables |
disp | (Not Recommended) Display dataset array |
display | (권장되지 않음) dataset형 배열 표시 |
double | (Not Recommended) Convert dataset variables to double array |
end | (Not Recommended) Last index in indexing expression for dataset array |
export | (Not Recommended) Write dataset array to file |
get | (Not Recommended) Access dataset array properties |
horzcat | (Not Recommended) Horizontal concatenation for dataset arrays |
intersect | (Not Recommended) Set intersection for dataset array observations |
isempty | (Not Recommended) True for empty dataset array |
ismember | (Not Recommended) Dataset array elements that are members of set |
ismissing | (Not Recommended) Find dataset array elements with missing values |
join | (Not Recommended) Merge dataset array observations |
length | (Not Recommended) Length of dataset array |
ndims | (Not Recommended) Number of dimensions of dataset array |
numel | (Not Recommended) Number of elements in dataset array |
replaceWithMissing | (Not Recommended) Insert missing data indicators into a dataset array |
replacedata | (Not Recommended) Replace dataset variables |
set | (Not Recommended) Set and display dataset array properties |
setdiff | (Not Recommended) Set difference for dataset array observations |
setxor | (Not Recommended) Set exclusive or for dataset array observations |
single | (Not Recommended) Convert dataset variables to single array |
size | (Not Recommended) Size of dataset array |
sortrows | (Not Recommended) Sort rows of dataset array |
stack | (Not Recommended) Stack dataset array from multiple variables into single variable |
subsasgn | (Not Recommended) Subscripted assignment to dataset array |
subsref | (Not Recommended) Subscripted reference for dataset array |
summary | (Not Recommended) Print summary of dataset array |
union | (Not Recommended) Set union for dataset array observations |
unique | (Not Recommended) Unique observations in dataset array |
unstack | (Not Recommended) Unstack dataset array from single variable into multiple variables |
vertcat | (Not Recommended) Vertical concatenation for dataset arrays |
속성
dataset형 배열 D
는 메타데이터(데이터에 대한 정보)를 저장하는 속성을 가집니다. P = D.Properties.PropName
또는 D.Properties.PropName = P
를 사용하여 속성에 액세스하거나 할당합니다. 여기서 PropName
은 다음 중 하나입니다.
|
|
|
dataset형 배열의 두 차원의 이름을 지정하는 문자형 벡터로 구성된 2개의 요소를 가진 셀형 배열입니다. 디폴트 값은 |
|
비어 있지 않은 셀형 배열로, dataset형 배열의 관측값의 이름을 지정하는 고유한 문자형 벡터입니다. 이 속성은 비어 있을 수 있습니다. 하지만 비어 있지 않은 경우 문자형 벡터의 개수는 관측값의 개수와 같아야 합니다. |
|
dataset형 배열의 변수의 단위를 지정하는 문자형 벡터로 구성된 셀형 배열입니다. 이 속성은 비어 있을 수 있습니다. 하지만 비어 있지 않은 경우 문자형 벡터의 개수는 변수의 개수와 같아야 합니다. 정의된 단위가 없는 변수의 경우 개별 문자형 벡터가 비어 있을 수 있습니다. 디폴트 값은 빈 셀형 배열입니다. |
|
dataset형 배열과 연결될 추가 정보를 포함하는 변수입니다. 디폴트 값은 빈 배열입니다. |
|
dataset형 배열의 변수에 대한 설명을 지정하는 문자형 벡터로 구성된 셀형 배열입니다. 이 속성은 비어 있을 수 있습니다. 하지만 비어 있지 않은 경우 문자형 벡터의 개수는 변수의 개수와 같아야 합니다. 정의된 설명이 없는 변수의 경우 개별 문자형 벡터가 비어 있을 수 있습니다. 디폴트 값은 빈 셀형 배열입니다. |
|
비어 있지 않은 셀형 배열로, dataset형 배열의 변수의 이름을 지정하는 고유한 문자형 벡터입니다. 문자형 벡터의 개수는 변수의 개수와 같아야 합니다. 디폴트 값은 데이터 세트를 만드는 데 사용되는 변수의 이름으로 구성된 셀형 배열입니다. |
복사 의미 체계
값입니다. 복사 의미 체계가 클래스에 영향을 미치는 방식을 알아보려면 MATLAB 객체 지향 프로그래밍 설명서의 핸들 클래스와 값 클래스 비교를 참조하십시오.
예제
.mat 파일에서 dataset형 배열을 불러오고 다음과 같은 간단한 서브셋을 만듭니다.
load hospital h1 = hospital(1:10,:) h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'}) % Access and modify metadata hospital.Properties.Description hospital.Properties.VarNames{4} = 'Wgt' % Create a new dataset variable from an existing one hospital.AtRisk = hospital.Smoker | (hospital.Age > 40) % Use individual variables to explore the data boxplot(hospital.Age,hospital.Sex) h3 = hospital(hospital.Age<30,... {'LastName' 'Age' 'Sex' 'Smoker'}) % Sort the observations based on two variables h4 = sortrows(hospital,{'Sex','Age'})