이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.
groupsummary
그룹 요약 계산
구문
설명
는 위에 열거된 구문에서 하나 이상의 이름-값 쌍을 사용하여 추가적인 그룹화 속성을 지정합니다. 예를 들어, G
= groupsummary(___,Name,Value
)G = groupsummary(T,'Category1','IncludeMissingGroups',false)
는 <undefined>
로 표시되는 누락된 categorical
형 데이터에서 만들어진 그룹을 제외합니다.
는 위에 열거된 모든 배열 구문에서 하나 이상의 이름-값 쌍을 사용하여 추가적인 그룹화 속성을 지정합니다.B
= groupsummary(___,Name,Value
)
예제
요약 통계량
테이블 변수에 대해 요약 통계량을 계산합니다.
5명의 개인에 대한 정보가 들어 있는 테이블 T
를 생성합니다.
Gender = ["male";"female";"female";"male";"male"]; Age = [38;43;38;40;49]; Height = [71;69;64;67;64]; Weight = [176;163;131;133;119]; T = table(Gender,Age,Height,Weight)
T=5×4 table
Gender Age Height Weight
________ ___ ______ ______
"male" 38 71 176
"female" 43 69 163
"female" 38 64 131
"male" 40 67 133
"male" 49 64 119
Gender
를 그룹화 변수로 지정하여 남성과 여성의 도수를 계산합니다.
G = groupsummary(T,"Gender")
G=2×2 table
Gender GroupCount
________ __________
"female" 2
"male" 3
여성과 남성의 평균 연령, 신장, 체중을 각각 계산합니다.
G = groupsummary(T,"Gender","mean")
G=2×5 table
Gender GroupCount mean_Age mean_Height mean_Weight
________ __________ ________ ___________ ___________
"female" 2 40.5 66.5 147
"male" 3 42.333 67.333 142.67
여전히 성별로 그룹화한 상태에서 여성과 남성의 중앙값 신장만 각각 계산합니다.
G = groupsummary(T,"Gender","median","Height")
G=2×3 table
Gender GroupCount median_Height
________ __________ _____________
"female" 2 66.5
"male" 3 67
여러 개의 그룹화 변수
2개의 그룹화 변수를 사용하여 테이블 데이터를 그룹화합니다.
5명의 개인에 대한 정보가 들어 있는 테이블 T
를 생성합니다.
Gender = ["male";"female";"male";"female";"male"]; Smoker = logical([1;0;1;0;1]); Weight = [176;163;131;133;119]; T = table(Gender,Smoker,Weight)
T=5×3 table
Gender Smoker Weight
________ ______ ______
"male" true 176
"female" false 163
"male" true 131
"female" false 133
"male" true 119
성별과 흡연 여부로 그룹화하여 평균 체중을 계산합니다. 여기서 성별과 흡연 여부의 조합 중 두 가지는 빈 그룹이므로 기본적으로 출력값에 표시되지 않습니다.
G = groupsummary(T,{'Gender','Smoker'},'mean','Weight')
G=2×4 table
Gender Smoker GroupCount mean_Weight
________ ______ __________ ___________
"female" false 2 148
"male" true 3 142
'IncludeEmptyGroups'
파라미터 값을 true
로 설정하여 빈 그룹을 포함한 모든 그룹 조합을 표시합니다.
G = groupsummary(T,{'Gender','Smoker'},'mean','Weight','IncludeEmptyGroups',true)
G=4×4 table
Gender Smoker GroupCount mean_Weight
________ ______ __________ ___________
"female" false 2 148
"female" true 0 NaN
"male" false 0 NaN
"male" true 3 142
그룹 빈 지정하기
지정된 빈에 따른 그룹 데이터입니다.
하나의 달에 포함된 여러 날짜의 판매량 정보가 들어 있는 타임테이블을 생성합니다.
TimeStamps = datetime([2017 3 4; 2017 3 2; 2017 3 15; 2017 3 10;... 2017 3 14; 2017 3 31; 2017 3 25;... 2017 3 29; 2017 3 21; 2017 3 18]); Profit = [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]'; TotalItemsSold = [14 13 8 5 10 16 8 6 7 11]'; TT = timetable(TimeStamps,Profit,TotalItemsSold)
TT=10×2 timetable
TimeStamps Profit TotalItemsSold
___________ ______ ______________
04-Mar-2017 2032 14
02-Mar-2017 3071 13
15-Mar-2017 1185 8
10-Mar-2017 2587 5
14-Mar-2017 1998 10
31-Mar-2017 2899 16
25-Mar-2017 3112 8
29-Mar-2017 909 6
21-Mar-2017 2619 7
18-Mar-2017 3085 11
판매된 총 아이템의 개수를 일정 간격으로 비닝하여 그룹화하고, 각 그룹별 평균 수익을 계산합니다.
format shorte G = groupsummary(TT,'TotalItemsSold',[0 4 8 12 16],'mean','Profit')
G=3×3 table
disc_TotalItemsSold GroupCount mean_Profit
___________________ __________ ___________
[4, 8) 3.0000e+00 2.0383e+03
[8, 12) 4.0000e+00 2.3450e+03
[12, 16] 3.0000e+00 2.6673e+03
요일별 평균 수익을 계산합니다.
G = groupsummary(TT,'TimeStamps','dayname','mean','Profit')
G=5×3 table
dayname_TimeStamps GroupCount mean_Profit
__________________ __________ ___________
Tuesday 2.0000e+00 2.3085e+03
Wednesday 2.0000e+00 1.0470e+03
Thursday 1.0000e+00 3.0710e+03
Friday 2.0000e+00 2.7430e+03
Saturday 3.0000e+00 2.7430e+03
벡터 데이터를 사용한 그룹 연산
날짜로 구성된 벡터와 이에 대응하는 수익값으로 구성된 벡터를 만듭니다.
timeStamps = datetime([2017 3 4; 2017 3 2; 2017 3 15; 2017 3 10; ... 2017 3 14; 2017 3 31; 2017 3 25; ... 2017 3 29; 2017 3 21; 2017 3 18]); profit = [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';
요일별 평균 수익을 계산합니다. 각 그룹의 평균, 그룹 이름, 구성원 수를 표시합니다.
format shorte [meanDailyProfit,dayOfWeek,dailyCounts] = groupsummary(profit,timeStamps,'dayname','mean')
meanDailyProfit = 5×1
2.3085
1.0470
3.0710
2.7430
2.7430
dayOfWeek = 5x1 categorical
Tuesday
Wednesday
Thursday
Friday
Saturday
dailyCounts = 5×1
2
2
1
2
3
벡터 입력값에 대한 여러 그룹화 벡터
성별과 흡연 상태에 따라 4개 그룹의 평균 체중을 계산합니다.
환자 정보를 서로 다른 유형의 벡터 3개로 저장합니다.
Gender = ["male";"female";"male";"female";"male"]; Smoker = logical([1;0;1;0;1]); Weight = [176;163;131;133;119];
성별과 흡연 상태에 따라 평균 체중을 계산합니다. B
는 각 그룹의 평균을 포함합니다(빈 그룹의 경우 NaN
). BG
는 그룹의 요소를 행별로 관찰했을 때 각 그룹을 설명하는 2개의 벡터를 포함하는 셀형 배열입니다. 예를 들어, BG{1}
의 첫 번째 행을 보면 첫 번째 그룹이 여성임을 알 수 있고, BG{2}
의 첫 번째 행을 보면 이들이 비흡연자임을 알 수 있습니다. 마지막으로, BC
는 BG
의 대응하는 그룹에 대한 각 그룹의 구성원 수를 포함합니다.
[B,BG,BC] = groupsummary(Weight,{Gender,Smoker},'mean','IncludeEmptyGroups',true); B
B = 4×1
148
NaN
NaN
142
BG{1}
ans = 4x1 string
"female"
"female"
"male"
"male"
BG{2}
ans = 4x1 logical array
0
1
0
1
BC
BC = 4×1
2
0
0
3
입력값이 여러 개인 메서드 함수 핸들
환자 정보를 포함하는 데이터를 불러와서 각 환자의 성별, 수축기 및 확장기 혈압, 신장, 체중을 설명하는 테이블을 만듭니다.
load patients
T = table(Gender,Systolic,Diastolic,Height,Weight)
T=100×5 table
Gender Systolic Diastolic Height Weight
__________ ________ _________ ______ ______
{'Male' } 124 93 71 176
{'Male' } 109 77 69 163
{'Female'} 125 83 64 131
{'Female'} 117 75 67 133
{'Female'} 122 80 64 119
{'Female'} 121 70 68 142
{'Female'} 130 88 64 142
{'Male' } 115 82 68 180
{'Male' } 115 78 68 183
{'Female'} 118 86 66 132
{'Female'} 114 77 68 128
{'Female'} 115 68 66 137
{'Male' } 127 74 71 174
{'Male' } 130 95 72 202
{'Female'} 114 79 65 129
{'Male' } 130 92 71 181
⋮
성별을 기준으로 그룹화하여 환자 신장과 체중 사이의 상관 및 수축기 혈압과 확장기 혈압 사이의 상관을 계산합니다. 상관을 계산하는 메서드로 xcov
함수를 사용합니다. xcov
에 대한 처음 두 개의 입력 인수는 상관을 구할 데이터를 설명하고, 세 번째 인수는 지연 크기를 설명하고, 네 번째 인수는 정규화 유형을 설명합니다. 각 그룹 계산에 대해, xcov
로 전달되는 x
인수와 y
인수는 두 개의 셀 요소 ["Height","Systolic"]
과 ["Weight","Diastolic"]
의 변수를 기준으로 쌍별(Pairwise)로 지정됩니다.
G = groupsummary(T,"Gender",@(x,y)xcov(x,y,0,'coeff'),{["Height","Systolic"],["Weight","Diastolic"]})
G=2×4 table
Gender GroupCount fun1_Height_Weight fun1_Systolic_Diastolic
__________ __________ __________________ _______________________
{'Female'} 53 0.071278 0.48731
{'Male' } 47 0.047571 0.50254
또는 데이터가 테이블이 아닌 벡터 또는 행렬 형식인 경우, 상관을 구할 데이터를 groupsummary
의 첫 번째 입력 인수로 제공할 수 있습니다.
[G,GR,GC] = groupsummary({[Height,Systolic],[Weight,Diastolic]},Gender,@(x,y)xcov(x,y,0,'coeff'))
G = 2×2
0.0713 0.4873
0.0476 0.5025
GR = 2x1 cell
{'Female'}
{'Male' }
GC = 2×1
53
47
입력 인수
T
— 입력 데이터
테이블 | 타임테이블
입력 데이터로, table형 또는 timetable형으로 지정됩니다.
A
— 입력 배열
벡터 | 행렬 | 셀형 배열
입력 배열로, 벡터, 행렬, 벡터 또는 행렬로 구성된 셀형 배열 중 하나로 지정됩니다.
둘 이상의 입력 인수를 받는 method
에 대해 함수 핸들을 지정하는 경우 입력 데이터 A
는 벡터 또는 행렬로 구성된 셀형 배열이어야 합니다. 각각의 그룹별 함수 호출에서, 입력 인수는 셀형 배열에 있는 각 요소의 대응되는 열입니다. 예를 들면 다음과 같습니다.
groupsummary({x1, y1},groupvars,@(x,y) myFun(x,y))
는 각 그룹에 대해myFun(x1,y1)
을 계산합니다.groupsummary({[x1 x2], [y1 y2]},groupvars,@(x,y) myFun(x,y))
는 먼저 각 그룹에 대해myFun(x1,y1)
을 계산한 다음 각 그룹에 대해myFun(x2,y2)
를 계산합니다.
groupvars
— 그룹화 변수 또는 벡터
스칼라 | 벡터 | 행렬 | 셀형 배열 | 함수 핸들 | 테이블 vartype
첨자
그룹화 변수 또는 벡터로, 다음과 같은 옵션 중 하나로 지정됩니다.
입력값이 배열인 경우
groupvars
는A
와 행 개수가 같은 열 벡터이거나 열 벡터로 구성된 행렬 또는 셀형 배열일 수 있습니다.table형 또는 timetable형 입력값의 경우
groupvars
는 데이터에서 어느 변수를 사용하여 그룹을 계산할지 나타냅니다. 이 표의 옵션으로 그룹화 변수를 지정할 수 있습니다.옵션 설명 예제 스칼라 변수 이름 단일 테이블 변수 이름을 지정하는 문자형 벡터 또는 string형 스칼라
'Var1'
"Var1"
변수 이름으로 구성된 벡터 각 요소가 테이블 변수 이름인, 문자형 벡터 또는 string형 배열로 구성된 셀형 배열
{'Var1' 'Var2'}
["Var1" "Var2"]
스칼라 또는 변수 인덱스로 구성된 벡터 스칼라 또는 테이블 변수 인덱스로 구성된 벡터
1
[1 3 5]
논리형 스칼라 또는 벡터 각각의 요소가 테이블 변수에 대응하는 논리형 벡터. 여기서
true
는 대응하는 변수를 포함하고false
는 대응하는 변수를 제외합니다.[true false true]
함수 핸들 테이블 변수를 입력값으로 받고 논리형 스칼라를 반환하는 함수 핸들
@isnumeric
vartype
첨자vartype
함수로 생성된 테이블 첨자vartype('numeric')
예: groupsummary(T,"Var3")
method
— 계산 방법
'sum'
| 'mean'
| 'median'
| 'mode'
| 'var'
| 'std'
| 'min'
| 'max'
| 'range'
| 'nummissing'
| 'nnz'
| 'all'
| 함수 핸들 | 셀형 배열
계산 방법으로, 다음 중 하나로 지정됩니다.
'sum'
— 합계'mean'
— 평균'median'
— 중앙값'mode'
— 최빈값'var'
— 분산'std'
— 표준편차'min'
— 최솟값'max'
— 최댓값'range'
— 최댓값에서 최솟값을 뺀 값'nummissing'
— 누락된 요소의 개수'nnz'
— 0이 아닌 요소와NaN
이 아닌 요소의 개수'all'
— 위에 나열된 모든 계산 결과
method
를 첫 번째 차원의 길이가 1인 그룹마다 한 개의 항목을 반환하는 함수 핸들로 지정할 수도 있습니다. table형 입력 데이터의 경우 함수는 각 테이블 변수에 대해 개별적으로 연산을 수행합니다.
입력 데이터가 테이블 T
이고 둘 이상의 입력 인수를 받는 method
에 대해 함수 핸들을 지정하는 경우 datavars
를 지정해야 합니다. datavars
인수는 셀형 배열이어야 하며, 이때 배열의 요소는 메서드의 각 입력값으로 사용할 테이블 변수를 나타냅니다. 각각의 그룹별 함수 호출에서, 입력 인수는 셀형 배열 요소들로 구성된 대응되는 테이블 변수입니다. 예를 들면 다음과 같습니다.
groupsummary(T,groupvars,@(x,y) myFun(x,y),{"x1","y1"})
은 각 그룹에 대해myFun(T.x1,T.y1)
을 계산합니다.groupsummary(T,groupvars,@(x,y) myFun(x,y),{["x1" "x2"],["y1" "y2"]})
는 먼저 각 그룹에 대해myfun(T.x1,T.y1)
을 계산한 다음 각 그룹에 대해myfun(T.x2,T.y2)
를 계산합니다.
입력 데이터가 벡터 또는 행렬 형식이고 둘 이상의 입력 인수를 받는 method
에 대해 함수 핸들을 지정하는 경우 입력 데이터 A
는 벡터 또는 행렬로 구성된 셀형 배열이어야 합니다. 각각의 함수 호출에서, 입력 인수는 셀형 배열에 있는 각 요소의 대응되는 열입니다. 예를 들면 다음과 같습니다.
groupsummary({x1,y1},groupvars,@(x,y) myFun(x,y))
는 각 그룹에 대해myFun(x1,y1)
을 계산합니다.groupsummary({[x1 x2],[y1 y2]},groupvars,@(x,y) myFun(x,y))
는 먼저 각 그룹에 대해myFun(x1,y1)
을 계산한 다음 각 그룹에 대해myFun(x2,y2)
를 계산합니다.
한 번에 여러 개의 계산을 지정하려면 옵션을 셀형 배열에 나열하십시오(예: {'mean','median'}
또는 {myFun1,myFun2}
).
입력 데이터의 NaN
값은 여기에 설명된 메서드 이름을 사용하는 경우 자동으로 생략됩니다('nummissing'
은 예외). NaN
값을 포함하려면 메서드의 함수 핸들을 사용하는 방안을 고려해 보십시오(예: 'sum'
대신 @sum
사용).
데이터형: char
| string
| cell
| function_handle
datavars
— 연산을 수행할 테이블 변수
스칼라 | 벡터 | 셀형 배열 | 함수 핸들 | 테이블 vartype
첨자
연산을 수행할 테이블 변수로, 다음 표에 있는 옵션 중 하나로 지정됩니다. datavars
는 메서드가 적용되는 입력 테이블 변수 또는 타임테이블 변수를 나타냅니다. datavars
로 지정되지 않은 다른 변수는 연산이 수행되지 않고 출력값으로 전달되지 않습니다. datavars
가 지정되지 않은 경우, groupsummary
는 각 비그룹화 변수에 대한 연산을 수행합니다.
옵션 | 설명 | 예제 |
---|---|---|
변수 이름 | 단일 테이블 변수 이름을 지정하는 문자형 벡터 또는 string형 스칼라 |
|
변수 이름으로 구성된 벡터 | 각 요소가 테이블 변수 이름인, 문자형 벡터 또는 string형 배열로 구성된 셀형 배열 |
|
스칼라 또는 변수 인덱스로 구성된 벡터 | 스칼라 또는 테이블 변수 인덱스로 구성된 벡터 |
|
논리형 벡터 | 각각의 요소가 테이블 변수에 해당하는 논리형 벡터. 여기서 |
|
함수 핸들 | 테이블 변수를 입력값으로 받고 논리형 스칼라를 반환하는 함수 핸들 |
|
vartype 첨자 |
|
|
입력 데이터가 테이블 T
이고 둘 이상의 입력 인수를 받는 method
에 대해 함수 핸들을 지정하는 경우 datavars
를 지정해야 합니다. datavars
인수는 셀형 배열이어야 하며, 이때 배열의 요소는 테이블의 옵션 중 하나입니다. 셀형 배열 요소는 메서드의 각 입력값으로 사용할 테이블 변수를 나타냅니다. 각각의 그룹별 함수 호출에서, 입력 인수는 셀형 배열 요소들로 구성된 대응되는 테이블 변수입니다. 예를 들면 다음과 같습니다.
groupsummary(T,groupvars,@(x,y) myFun(x,y),{"x1", "y1"})
은 각 그룹에 대해myFun(T.x1,T.y1)
을 계산합니다.groupsummary(T,groupvars,@(x,y) myFun(x,y),{["x1" "x2"],["y1" "y2"]})
는 먼저 각 그룹에 대해myfun(T.x1,T.y1)
을 계산한 다음 각 그룹에 대해myfun(T.x2,T.y2)
를 계산합니다.
예: groupsummary(T,groupvars,method,["Var1" "Var2" "Var4"])
groupbins
— 비닝 방식
'none'
(디폴트 값) | 벡터 | 스칼라 | 셀형 배열
비닝 방식으로, 다음 옵션 중 하나로 지정됩니다.
'none'
, 즉 비닝하지 않음datetime
그룹화 변수 또는 벡터에 대해datetime
형 벡터 또는 숫자형 벡터로 지정된 Bin 경계값 목록정수 스칼라로 지정된 Bin의 개수
duration
또는calendarDuration
유형의 스칼라로 지정된, Bin 너비를 나타내는 지속 시간(datetime
또는duration
그룹화 변수 또는 벡터에만 해당)다음 문자형 벡터 중 하나로 지정된 시간 Bin(
datetime
및duration
그룹화 변수 또는 벡터에만 해당)값 설명 데이터형 'second'
각 Bin은 1초입니다.
datetime
및duration
'minute'
각 Bin은 1분입니다.
datetime
및duration
'hour'
각 Bin은 1시간입니다.
datetime
및duration
'day'
각 Bin은 달력상의 1일입니다. 이 값은 일광 절약 시간제 변동을 고려합니다.
datetime
및duration
'week'
각 Bin은 달력상의 1주일입니다. datetime
만'month'
각 Bin은 달력상의 1개월입니다. datetime
만'quarter'
각 Bin은 달력상의 1사분기입니다. datetime
만'year'
각 Bin은 달력상의 1년입니다. 이 값은 윤일을 고려합니다.
datetime
및duration
'decade'
각 Bin은 10년(달력상의 10년)입니다. datetime
만'century'
각 Bin은 1세기(달력상의 100년)입니다. datetime
만'secondofminute'
Bin은 0~59 사이의 초입니다.
datetime
만'minuteofhour'
Bin은 0~59 사이의 분입니다.
datetime
만'hourofday'
Bin은 0~23 사이의 시입니다.
datetime
만'dayofweek'
Bin은 1~7 사이의 요일입니다. 한 주의 첫째 날은 일요일입니다.
datetime
만'dayname'
Bin은 요일의 전체 이름입니다(예: 'Sunday'
).datetime
만'dayofmonth'
Bin은 1~31 사이의 일입니다. datetime
만'dayofyear'
Bin은 1~366 사이의 일입니다. datetime
만'weekofmonth'
Bin은 1~6 사이의 주입니다. datetime
만'weekofyear'
Bin은 1~54 사이의 주입니다. datetime
만'monthname'
Bin은 월의 전체 이름입니다(예: 'January'
).datetime
만'monthofyear'
Bin은 1~12 사이의 월입니다.
datetime
만'quarterofyear'
Bin은 1~4 사이의 분기입니다. datetime
만각 그룹화 변수 또는 벡터의 비닝 규칙을 나열하는 셀형 배열
여러 그룹화 변수가 지정된 경우 모든 그룹화 변수에 적용되는 단일 비닝 규칙을 제공하거나 각 그룹화 변수에 대한 비닝 방법을 포함하는 셀형 배열(예: {'none',[0 2 4 Inf]}
)을 제공할 수 있습니다.
이름-값 인수
예: G = groupsummary(T,groupvars,groupbins,'IncludedEdge','right')
선택적으로 Name,Value
인수가 쉼표로 구분되어 지정됩니다. 여기서 Name
은 인수 이름이고 Value
는 대응값입니다. Name
은 따옴표 안에 표시해야 합니다. Name1,Value1,...,NameN,ValueN
과 같이 여러 개의 이름-값 쌍의 인수를 어떤 순서로든 지정할 수 있습니다.
IncludedEdge
— 포함된 Bin 경계
'left'
(디폴트 값) | 'right'
포함된 Bin 경계로, 'left'
또는 'right'
로 지정되며, Bin 구간의 어느 끝을 포함하는지 나타냅니다.
이 이름-값 쌍은 groupbins
가 지정된 경우에만 지정할 수 있으며, 값은 모든 그룹화 변수 또는 벡터의 모든 비닝 방식에 적용됩니다.
IncludeMissingGroups
— 누락된 그룹 표시자
true
(디폴트 값) | false
누락된 그룹 표시자로, true
또는 false
로 지정됩니다. 파라미터 값이 true
인 경우, groupsummary
는 누락값으로 구성된 그룹을 표시합니다(예: NaN
). 파라미터 값이 false
인 경우, groupsummary
는 누락된 그룹을 표시하지 않습니다.
데이터형: logical
IncludeEmptyGroups
— 빈 그룹 표시자
false
(디폴트 값) | true
빈 그룹 표시자로, true
또는 false
로 지정됩니다. 파라미터 값이 false
인 경우, groupsummary
는 요소를 포함하지 않는 그룹을 표시하지 않습니다. 파라미터 값이 true
인 경우, groupsummary
는 빈 그룹을 표시합니다.
데이터형: logical
출력 인수
G
— 출력 테이블
테이블
출력 테이블로, 그룹의 계산 결과가 테이블로 반환됩니다.
B
— 출력 배열
벡터 | 행렬
출력 배열로, 그룹화 계산 결과가 벡터 또는 행렬로 반환됩니다. 여러 방법을 지정하는 경우 groupsummary
는 나열된 순서대로 계산 결과를 가로로 결합합니다.
BG
— 그룹
열 벡터 | 열 벡터로 구성된 셀형 배열
배열 입력 데이터에 대한 그룹으로, 열 벡터로 반환되거나 각각의 그룹화 벡터에 대응하는 열 벡터로 구성된 셀형 배열로 반환됩니다.
둘 이상의 그룹화 벡터를 제공하는 경우 BG
는 동일한 길이의 열 벡터를 포함하는 셀형 배열입니다. 그룹 정보는 BG
의 모든 벡터의 요소를 행별로 관찰하여 찾을 수 있습니다. 각 그룹은 출력 배열 B
의 대응하는 행으로 매핑됩니다.
BC
— 그룹 도수
열 벡터
배열 입력 데이터의 그룹 도수로, 각 그룹의 요소 개수가 열 벡터로 반환됩니다. BC
의 길이는 BG
로 반환된 그룹 열 벡터의 길이와 같습니다.
팁
groupsummary
를 여러 번 호출하는 경우에는 성능 향상을 위해 그룹화 변수를categorical
유형이나logical
유형으로 변환하는 것이 좋습니다. 예를 들어, 유형이char
인 그룹화 변수가 있는 경우(예: 요소가'Male'
과'Female'
인Gender
) 명령categorical(Gender)
를 사용하여 그룹화 변수를 categorical형 값으로 변환할 수 있습니다.
확장 기능
tall형 배열
메모리에 담을 수 없을 정도로 많은 행을 가진 배열을 계산할 수 있습니다.
사용법 관련 참고 및 제한 사항:
A
와groupvars
가 모두 tall형 행렬이면 이 둘은 행 개수가 같아야 합니다.첫 번째 입력값이 tall형 행렬이면
groupvars
는 tall형 그룹화 벡터를 포함하는 셀형 배열일 수 있습니다.groupvars
및datavars
인수는 함수 핸들을 지원하지 않습니다.'IncludeEmptyGroups'
이름-값 쌍은 지원되지 않습니다.'median'
메서드와'mode'
메서드는 지원되지 않습니다.tall datetime형 배열에는
'std'
메서드가 지원되지 않습니다.method
인수가 함수 핸들인 경우 이 인수는 tall형 배열에 대해 동작하는splitapply
에 유효한 입력값이어야 합니다. 함수 핸들이 여러 개의 입력값을 받는 경우groupsummary
에 대한 첫 번째 입력값은 tall형 테이블이어야 합니다.그룹의 순서는 메모리 내
groupsummary
계산에 사용된 순서와 다를 수 있습니다.이산화된 datetime형 배열을 기준으로 그룹화할 경우 categorical형 그룹 이름은 메모리 내
groupsummary
계산에 사용된 그룹 이름과 다릅니다.
자세한 내용은 tall형 배열 항목을 참조하십시오.
스레드 기반 환경
MATLAB®의 backgroundPool
을 사용해 백그라운드에서 코드를 실행하거나 Parallel Computing Toolbox™의 ThreadPool
을 사용해 코드 실행 속도를 높일 수 있습니다.
이 함수는 스레드 기반 환경을 완전히 지원합니다. 자세한 내용은 Run MATLAB Functions in Thread-Based Environment 항목을 참조하십시오.
버전 내역
MATLAB 명령
다음 MATLAB 명령에 해당하는 링크를 클릭했습니다.
명령을 실행하려면 MATLAB 명령 창에 입력하십시오. 웹 브라우저는 MATLAB 명령을 지원하지 않습니다.
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)