Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

rowfun

테이블 또는 타임테이블 행에 함수 적용

설명

B = rowfun(func,A)는 함수 func을 테이블 또는 타임테이블 A의 각 행에 적용하고 결과를 테이블 또는 타임테이블 B에 반환합니다.

함수 func가 받는 입력값의 개수는 A의 변수의 개수와 같아야 합니다. 예를 들어, func를 2개의 입력 인수를 사용하여 호출해야 하는 경우, A에도 2개의 변수가 있어야 합니다. 테이블의 변수 개수를 확인하려면 width 함수를 사용하십시오.

예제

B = rowfun(func,A,Name,Value)는 함수 func을 하나 이상의 Name,Value 인수로 추가 옵션을 지정하여 테이블 A의 각 행에 적용합니다.

예를 들어, "GroupingVariables" 이름-값 인수를 사용하여 행 그룹에 대한 계산을 수행할 수 있습니다. 데이터 그룹 계산에 대한 자세한 내용은 데이터 그룹에 대한 계산 항목을 참조하십시오.

예제

모두 축소

숫자형 데이터로 구성된 두 개의 변수를 갖는 테이블 A를 만듭니다.

rng('default')
X = randi(10,[5,1]);
Y = randi(10,[5,1]);
A = table(X,Y)
A=5×2 table
    X     Y 
    __    __

     9     1
    10     3
     2     6
    10    10
     7    10

함수 plusA의 각 행에 적용합니다. 함수 호출 plus(X,Y)는 연산 X + Y와 동일합니다. plus 함수는 두 개의 입력값을 받아 하나의 출력값을 반환합니다. 함수를 rowfun에 대한 입력 인수로 지정하려면 @ 기호를 사용하십시오.

B = rowfun(@plus,A,"OutputVariableNames","Sum")
B=5×1 table
    Sum
    ___

    10 
    13 
     8 
    20 
    17 

출력 테이블 B를 입력 테이블 A에 추가합니다.

C = [A B]
C=5×3 table
    X     Y     Sum
    __    __    ___

     9     1    10 
    10     3    13 
     2     6     8 
    10    10    20 
     7    10    17 

여러 개의 출력값을 반환하는 함수를 테이블의 행에 적용합니다. rowfun 함수는 적용된 함수의 각 출력값을 출력 테이블의 변수 하나에 저장합니다.

readtable 함수를 사용하여 CSV(쉼표로 구분된 값) 파일인 testScores.csv의 데이터를 테이블로 읽어올 수 있습니다. 샘플 파일에는 두 학교에 다니는 학생 10명의 테스트 점수가 포함되어 있습니다. 출력 테이블에는 숫자형 데이터를 가지는 변수와 텍스트 데이터를 가지는 다른 변수가 포함됩니다. 이러한 변수 중 하나인 School에는 고정된 값 집합 또는 범주 집합이 있습니다. 이러한 범주는 이 테이블 내에 있는 두 개의 학생 그룹을 나타냅니다. School을 categorical형 변수로 변환합니다.

scores = readtable("testScores.csv","TextType","string");
scores.School = categorical(scores.School)
scores=10×5 table
     LastName       School      Test1    Test2    Test3
    __________    __________    _____    _____    _____

    "Jeong"       XYZ School     90       87       93  
    "Collins"     XYZ School     87       85       83  
    "Torres"      XYZ School     86       85       88  
    "Phillips"    ABC School     75       80       72  
    "Ling"        ABC School     89       86       87  
    "Ramirez"     ABC School     96       92       98  
    "Lee"         XYZ School     78       75       77  
    "Walker"      ABC School     91       94       92  
    "Garcia"      ABC School     86       83       85  
    "Chang"       XYZ School     79       76       82  

각 행의 테스트 점수 최솟값과 최댓값을 구하려면 bounds 함수를 사용하십시오. bounds 함수는 두 개의 출력 인수를 반환하므로, rowfun을 사용하여 이 함수를 scores에 적용합니다. rowfun의 출력값은 TestMinTestMax 변수를 포함하는 새 테이블입니다. 또한, 이 경우에는 각 행의 값들이 bounds로 전달되기 전에 벡터로 결합되도록 "SeparateInputs"false로 지정합니다.

vars = ["Test1","Test2","Test3"];
minmaxTest = rowfun(@bounds, ...
                    scores, ...
                    "InputVariables",vars, ...
                    "OutputVariableNames",["TestMin","TestMax"], ...
                    "SeparateInputs",false)
minmaxTest=10×2 table
    TestMin    TestMax
    _______    _______

      87         93   
      83         87   
      85         88   
      72         80   
      86         89   
      92         98   
      75         78   
      91         94   
      83         86   
      76         82   

최솟값과 최댓값을 scores에 추가할 수 있습니다.

scores = [scores minmaxTest]
scores=10×7 table
     LastName       School      Test1    Test2    Test3    TestMin    TestMax
    __________    __________    _____    _____    _____    _______    _______

    "Jeong"       XYZ School     90       87       93        87         93   
    "Collins"     XYZ School     87       85       83        83         87   
    "Torres"      XYZ School     86       85       88        85         88   
    "Phillips"    ABC School     75       80       72        72         80   
    "Ling"        ABC School     89       86       87        86         89   
    "Ramirez"     ABC School     96       92       98        92         98   
    "Lee"         XYZ School     78       75       77        75         78   
    "Walker"      ABC School     91       94       92        91         94   
    "Garcia"      ABC School     86       83       85        83         86   
    "Chang"       XYZ School     79       76       82        76         82   

입력 테이블의 행 그룹에서 가져온 데이터에 함수를 적용합니다. 출력 테이블은 각 그룹에 대해 하나의 행을 포함합니다.

CSV(쉼표로 구분된 값) 파일 testScores.csv의 데이터를 테이블로 읽어옵니다. 파일에는 서로 다른 두 학교에 다니는 학생 10명의 테스트 점수가 포함되어 있습니다.

scores = readtable("testScores.csv","TextType","string");
scores.School = categorical(scores.School)
scores=10×5 table
     LastName       School      Test1    Test2    Test3
    __________    __________    _____    _____    _____

    "Jeong"       XYZ School     90       87       93  
    "Collins"     XYZ School     87       85       83  
    "Torres"      XYZ School     86       85       88  
    "Phillips"    ABC School     75       80       72  
    "Ling"        ABC School     89       86       87  
    "Ramirez"     ABC School     96       92       98  
    "Lee"         XYZ School     78       75       77  
    "Walker"      ABC School     91       94       92  
    "Garcia"      ABC School     86       83       85  
    "Chang"       XYZ School     79       76       82  

각 학생의 테스트 점수 평균을 계산하고 새 테이블 변수로 추가합니다. 이를 수행하는 한 가지 방법은 숫자형 테스트 점수를 추출한 다음 두 번째 차원을 따라 평균을 계산하는 것입니다. 결과는 열 벡터입니다. 이 열 벡터를 scores에 새 변수로 추가할 수 있습니다.

scores.TestMean = mean(scores{:,["Test1","Test2","Test3"]},2)
scores=10×6 table
     LastName       School      Test1    Test2    Test3    TestMean
    __________    __________    _____    _____    _____    ________

    "Jeong"       XYZ School     90       87       93           90 
    "Collins"     XYZ School     87       85       83           85 
    "Torres"      XYZ School     86       85       88       86.333 
    "Phillips"    ABC School     75       80       72       75.667 
    "Ling"        ABC School     89       86       87       87.333 
    "Ramirez"     ABC School     96       92       98       95.333 
    "Lee"         XYZ School     78       75       77       76.667 
    "Walker"      ABC School     91       94       92       92.333 
    "Garcia"      ABC School     86       83       85       84.667 
    "Chang"       XYZ School     79       76       82           79 

학교별로 테스트 점수의 평균이 가장 높은 학생을 찾습니다. 이 예제에 첨부된 지원 함수 findNameAtMax는 최고 점수와 해당 점수를 획득한 학생의 이름을 모두 반환합니다. 각 학생 그룹에 findNameAtMax를 적용하려면 rowfun을 사용하십시오. findNameAtMax는 여러 개의 입력 인수(학생의 이름과 테스트 점수)를 갖고 여러 개의 출력 인수를 반환하므로 rowfun 함수가 적합합니다. 출력 테이블의 변수 GroupCount는 각 학교에 대한 scores의 행 개수를 나타냅니다.

maxScoresBySchool = rowfun(@findNameAtMax, ...
                           scores, ...
                           "InputVariables",["LastName","TestMean"], ...
                           "GroupingVariables","School", ...
                           "OutputVariableNames",["max_TestMean","LastName"])
maxScoresBySchool=2×4 table
      School      GroupCount    max_TestMean    LastName 
    __________    __________    ____________    _________

    ABC School        5            95.333       "Ramirez"
    XYZ School        5                90       "Jeong"  

function [maxValue,lastName] = findNameAtMax(names,values)
    % Return maximum value and the last name 
    % from the row at which the maximum value occurred
    [maxValue,maxIndex] = max(values);
    lastName = names(maxIndex);
end

입력 인수

모두 축소

함수로, 함수 핸들로 지정됩니다. 기존 함수의 핸들을 지정하거나, 함수를 파일에 정의하거나, 함수를 익명 함수로 정의할 수 있습니다. func가 둘 이상의 함수 파일에 대응하는 경우(즉, func가 일련의 오버로드된 함수를 나타내는 경우) MATLAB®은 입력 인수의 클래스에 따라 어떤 함수를 호출할지를 결정합니다.

함수 funcwidth(A)개의 입력값을 받아야 합니다. 기본적으로, rowfunfunc의 첫 번째 출력을 반환합니다. func의 출력값을 두 개 이상 반환하려면 "NumOutputs" 또는 "OutputVariableNames" 이름-값 인수를 사용하십시오.

예: func = @minus;는 두 개의 입력값을 받아서 첫 번째 입력값에서 두 번째 입력값을 뺍니다.

예: func = @(x,y) x.^2+y.^2;에서는 두 개의 입력값을 가져와서 제곱의 합을 구합니다.

입력 테이블로, table형이나 timetable형으로 지정됩니다.

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: InputVariables=["Var2","Var3"]func의 입력값으로 AVar2 변수와 Var3 변수만 사용합니다.

func에 전달할 A의 변수를 선택하기 위한 지정자로, "InputVariables"와 함께 양의 정수, 양의 정수로 구성된 벡터, string형 배열, 문자형 벡터, 문자형 벡터로 구성된 셀형 배열, pattern 스칼라, 논리형 벡터 또는 함수 핸들로 지정됩니다.

"InputVariables"를 함수 핸들로 지정하는 경우, 이것은 논리형 스칼라를 반환해야 하고, rowfunA에서 함수가 1(true)을 반환하는 변수만 전달합니다.

그룹화 변수가 될 A의 변수를 선택하기 위한 지정자로, "GroupingVariables"와 함께 양의 정수, 양의 정수로 구성된 벡터, string형 배열, 문자형 벡터, 문자형 벡터로 구성된 셀형 배열, pattern 스칼라 또는 논리형 벡터로 지정됩니다.

그룹화 변수의 고유한 값은 그룹을 지정합니다. A에서 그룹화 변수 값이 같은 행은 같은 그룹에 속합니다. rowfunfuncA의 각 행에 개별적으로 적용하는 대신 각 행 그룹에 적용합니다. 출력값 B는 각 그룹에 대한 하나의 행을 포함합니다. 그룹화 변수를 사용한 계산에 대한 자세한 내용은 데이터 그룹에 대한 계산 항목을 참조하십시오.

그룹화 변수는 다음 표에 나열된 임의의 데이터형을 가질 수 있습니다.

그룹을 지정하는 값

그룹화 변수의 데이터형

숫자

숫자형 벡터 또는 논리형 벡터

텍스트

string형 배열, 또는 문자형 벡터로 구성된 셀형 배열

날짜/시간

datetime형 벡터, duration형 벡터 또는 calendarDuration형 벡터

범주

categorical형 벡터

Bin

숫자형 값, datetime형 값 또는 duration형 값의 연속 분포를 비닝하여 생성된 비닝된 값으로 구성된 벡터

그룹화 변수가 NaN 또는 누락값(예: NaT, 정의되지 않은 categorical형 값 또는 누락값인 string형)을 포함하는 경우, 이에 해당하는 행은 어떤 그룹에도 속하지 않으며 출력값에서 제외됩니다.

행 레이블은 그룹화 변수일 수 있습니다. 사용자는 행 레이블만을 기준으로, 또는 하나 이상의 A의 변수를 기준으로, 또는 행 레이블과 변수를 함께 기준으로 하여 그룹화할 수 있습니다.

  • A가 테이블인 경우 레이블은 행 이름입니다.

  • A가 타임테이블인 경우 레이블은 행 시간값입니다.

출력값 B는 입력값 A의 각 행 그룹에 대한 하나의 행을 포함합니다. B가 테이블 또는 타임테이블이면 B는 다음을 포함합니다.

  • func가 적용된 입력 테이블 변수에 대응하는 변수.

  • 그룹화 변수에 대응하는 변수.

  • 값이 각 그룹에 있는 입력값 A의 행 개수인 새로운 변수 GroupCount.

참고: B가 타임테이블이면 B는 다음도 포함합니다.

  • A의 각 행 그룹의 첫 번째 행 시간값이 B의 대응하는 행 시간값인 행 시간값. B를 행 시간값이 없는 테이블로 반환하려면 "OutputFormat""table"로 지정하십시오.

개별 입력값으로 func를 호출할지 여부에 대한 표시자로, "SeparateInputs"와 함께 true, false, 1, 0 중 하나가 지정됩니다.

true(디폴트 값)

func는 개별 입력값을 필요로 합니다. rowfun은 각 데이터 변수에 대해 하나의 인수를 사용해 width(A)개 입력값으로 func를 호출합니다.

false

func는 모든 입력값을 포함하는 하나의 인수를 필요로 합니다. rowfunA의 각 행에 있는 값들을 결합하여 func에 대한 입력 인수를 만듭니다.

예를 들어, A가 세 개의 변수를 갖는 테이블이고 각 변수가 숫자형 벡터인 경우, "SeparateInputs",false를 지정하면 rowfun이 세 개의 숫자형 벡터를 하나의 숫자형 행렬로 결합합니다. 이 행렬은 세 개의 열을 갖습니다. 그런 다음 rowfun이 이 행렬을 func에 하나의 입력 인수로 전달합니다.

func에 셀형 변수의 값을 전달할지 여부에 대한 표시자로, "ExtractCellContents"와 함께 false, true, 0, 1 중 하나가 지정됩니다.

true

rowfun은 데이터형이 cellA의 변수의 내용을 추출해 셀이 아니라 그 셀의 값을 func에 전달합니다.

그룹화 계산의 경우, 셀형 변수의 각 그룹 내 값은 세로 결합이 가능해야 합니다.

false

rowfun은 데이터형이 cellA의 변수의 셀을 func에 전달합니다.

이는 디폴트 동작입니다.

func의 출력값에 대한 변수 이름으로, "OutputVariableNames"와 함께 비어 있지 않은 고유한 이름을 갖는 문자형 벡터, 문자형 벡터로 구성된 셀형 배열 또는 string형 배열이 지정됩니다. 이름의 개수는 func에서 필요한 출력값의 개수와 같아야 합니다.

또한, 변수 이름은 유효한 MATLAB 식별자여야 합니다. 유효한 MATLAB 식별자를 변수 이름으로 사용할 수 없는 경우 MATLAB에서는 {'Var1' ... 'VarN'} 형식의 N개 문자형 벡터로 구성된 셀형 배열을 사용합니다. 여기서 N은 변수의 개수입니다. 유효한 MATLAB 변수 이름은 함수 isvarname을 사용하여 확인할 수 있습니다.

func에서 얻는 출력값 개수로, "NumOutputs"와 함께 0이나 양의 정수가 지정됩니다. 정수는 func에서 가능한 출력값 개수보다 작거나 같아야 합니다.

예: "NumOutputs",2를 사용하면 rowfun이 두 개의 출력값으로 func를 호출합니다.

B의 형식으로, "OutputFormat"과 함께 값 "auto", "table", "timetable", "uniform", "cell" 중 하나로 지정됩니다.

"auto"(디폴트 값) (R2023a 이후)

rowfun은 데이터형이 입력값 A의 데이터형과 일치하는 출력값을 반환합니다.

"table"

rowfunfunc의 각 출력값에 대해 하나의 변수를 갖는 테이블을 반환합니다. 그룹화 계산의 경우, B에는 그룹화 변수와 새 GroupCount 변수도 포함됩니다.

"table"을 사용하면 크기나 데이터형이 다른 값들을 반환하는 함수를 사용할 수 있습니다. 그러나, 그룹화되지 않은 계산의 경우 func의 모든 출력값에는 이 함수가 호출될 때마다 하나의 행이 있어야 합니다. 그룹화된 계산의 경우, func의 모든 출력값에는 같은 수의 행이 있어야 합니다.

A가 테이블인 경우 이것은 디폴트 출력 형식입니다.

"timetable"

rowfunA의 각 변수(또는 "InputVariables"로 지정한 각 변수)에 대한 변수를 하나씩 포함한 타임테이블을 반환합니다. 그룹화 계산의 경우, B에는 그룹화 변수와 새 GroupCount 변수도 포함됩니다.

rowfunA의 행 시간값에서 B의 행 시간값을 만듭니다. B에 할당된 행 시간값이 func를 사용하여 수행된 계산 맥락에서 타당하지 않은 경우, 출력 형식을 "OutputFormat","table"로 지정하십시오.

A가 타임테이블인 경우 이것은 디폴트 출력 형식입니다.

"uniform"

rowfunfunc에서 반환된 값을 벡터에 결합합니다. func에서 생성되는 모든 출력값은 동일한 데이터형의 스칼라여야 합니다.

"cell"

rowfun은 출력값을 셀형 배열로 반환합니다. "cell"을 사용하면 크기나 데이터형이 다른 값들을 반환하는 함수를 사용할 수 있습니다.

func가 실패할 경우 호출할 함수로, "ErrorHandler"와 함께 함수 핸들로 지정됩니다. 오류를 다시 발생시키거나 함수 func에 대해 유효한 출력값을 반환하도록 이 함수를 정의합니다.

MATLAB에서는 다음과 같이 2개의 입력 인수로 지정된 오류 처리 함수를 호출합니다.

  • 다음 필드를 포함한 구조체:

    identifier

    오류 ID입니다.

    message

    오류 메시지 텍스트입니다.

    index

    오류가 발생한 행 또는 그룹의 인덱스.

  • 오류 발생 시 함수 func의 입력 인수 세트

예를 들면 다음과 같습니다.

function [A, B] = errorFunc(S, varargin)
warning(S.identifier, S.message);
A = NaN; B = NaN;

출력 인수

모두 축소

출력값으로, 테이블, 타임테이블, 셀형 배열 또는 벡터로 반환됩니다.

B가 테이블 또는 타임테이블이면 설명, 변수 단위, 변수 이름, 행 이름과 같은 메타데이터를 저장할 수 있습니다. 자세한 내용은 table 또는 timetable 속성 설명을 참조하십시오.

세부 정보

모두 축소

데이터 그룹에 대한 계산

데이터 분석에서는 일반적으로 데이터 그룹에 대한 계산을 수행합니다. 이러한 계산의 경우 하나 이상의 데이터 변수를 데이터 그룹으로 분할하고, 각 그룹에 대해 계산을 수행하고, 결과를 하나 이상의 출력 변수로 조합합니다. 하나 이상의 그룹화 변수를 사용하여 그룹을 지정할 수 있습니다. 그룹화 변수의 고유 값은 데이터 변수의 대응값이 속하는 그룹을 정의합니다.

예를 들어, 다음 도식은 6×1 숫자형 벡터를 두 개의 데이터 그룹으로 분할하고 각 그룹의 평균을 계산한 다음 출력값을 2×1 숫자형 벡터로 조합하는 그룹화된 간단한 계산을 보여줍니다. 6×1 그룹화 변수에는 두 개의 고유한 값 ABXYZ가 있습니다.

Calculation that splits a data variable based on a grouping variable, performs calculations on individual groups of data by applying the same function, and then concatenates the outputs of those function calls

숫자, 텍스트, 날짜/시간, 범주 또는 Bin이 포함된 그룹화 변수를 지정할 수 있습니다.

확장 기능

스레드 기반 환경
MATLAB®의 backgroundPool을 사용해 백그라운드에서 코드를 실행하거나 Parallel Computing Toolbox™의 ThreadPool을 사용해 코드 실행 속도를 높일 수 있습니다.

버전 내역

R2013b에 개발됨

모두 확장