Main Content

contains

패턴이 문서 내 부분문자열에서 일치하는지 검사

R2022b 이후

    설명

    예제

    tf = contains(documents,pat)documents의 토큰 중 pat를 포함하는 토큰이 있는 경우 1을 반환하고, 그 외의 경우에는 0을 반환합니다.

    tf = contains(documents,pat,IgnoreCase=flag)는 부분문자열을 검사할 때 대/소문자를 무시할지 여부도 지정합니다.

    contains 함수를 사용하면 부분문자열 또는 패턴을 지정하여 문서 내 단어의 부분문자열을 검사할 수 있습니다. 문서 내 전체 단어와 n-gram을 검사하려면 각각 containsWords 함수와 containsNgrams 함수를 사용하십시오.

    예제

    모두 축소

    토큰화된 문서로 구성된 배열을 만듭니다.

    documents = tokenizedDocument([
        "an example of a short sentence" 
        "a second short sentence"]);

    문자열 "short"와 일치하는 항목이 있는지 검사합니다.

    tf = contains(documents,"short")
    tf = 2x1 logical array
    
       1
       1
    
    

    문자열 "ex"와 일치하는 항목이 있는지 검사합니다.

    tf = contains(documents,"ex")
    tf = 2x1 logical array
    
       1
       0
    
    

    입력 인수

    모두 축소

    입력 문서로, tokenizedDocument 배열로 지정됩니다.

    검사할 부분문자열 또는 패턴으로, 다음 값 중 하나로 지정됩니다.

    • string형 배열

    • 문자형 벡터

    • 문자형 벡터로 구성된 셀형 배열

    • pattern 배열

    pat에 여러 개의 부분문자열이나 패턴이 포함된 경우 함수는 대응되는 문서에 일치하는 부분문자열이나 패턴이 하나라도 나타나면 1을 반환합니다.

    대/소문자를 무시하는 옵션으로, 다음 값 중 하나로 지정됩니다.

    • 0 (false) – 대/소문자만 다른 일치 항목 후보를 일치하지 않는 것으로 처리합니다.

    • 1 (true) – 대/소문자만 다른 일치 항목 후보를 일치하는 것으로 처리합니다.

    데이터형: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical

    버전 내역

    R2022b에 개발됨