MATLAB 도움말 센터
문자열을 문자소로 분할
newStr = splitGraphemes(str)
newStr = splitGraphemes(str)은 문자열 str을 문자소로 분할합니다. 문자소(문자소 클러스터라고도 함)는 사람이 인식하는 문자를 뜻하는 유니코드 용어입니다.
newStr
str
예제
모두 축소
splitGraphemes 함수를 사용하여 텍스트를 문자소로 분할합니다.
splitGraphemes
문자소(문자소 클러스터라고도 함)는 사람이 인식하는 문자를 뜻하는 유니코드 용어입니다. 일부 문자소의 경우 코드 단위를 여러 개 포함하고 있습니다. 예를 들어 "선글라스를 끼고 웃고 있는 얼굴" 이모지(코드 포인트 U+1F60E)는 단일 문자소이지만, 두 개의 UTF16 코드 단위 "D83D"와 "DE0E"로 구성됩니다.
"D83D"
"DE0E"
텍스트 "Smile! "을 문자소로 분할합니다.
"Smile! "
str = "Smile! " + compose("\xD83D\xDE0E")
str = "Smile! "
newStr = 8×1 string "S" "m" "i" "l" "e" "!" " " ""
여기서 이 함수는 이모지를 여러 개의 문자로 분할하지는 않습니다.
입력 텍스트로, string형 배열, 문자형 벡터 또는 문자형 벡터로 구성된 셀형 배열로 지정됩니다. string형 배열 및 셀형 배열 입력값의 경우 str의 각 요소는 문자소 개수가 동일해야 합니다.
str의 각 요소 간에 문자소 개수가 같지 않다면, for 루프에서 이 함수를 호출하여 str의 요소를 한 번에 하나씩 분할하십시오.
데이터형: string | char | cell
string
char
cell
분할된 문자소로, string형 배열이나 문자형 벡터로 구성된 셀형 배열로 반환됩니다. str이 string형 배열이면 newStr도 string형 배열입니다. 그렇지 않으면, newStr은 문자형 벡터로 구성된 셀형 배열입니다.
newStr의 크기는 다음과 같이 입력값에 따라 달라집니다.
str이 string형 스칼라이거나 문자형 벡터인 경우 newStr은 numGraphemes×1 string형 배열이거나 셀형 배열입니다. 여기서 numGraphemes는 문자소 개수입니다.
numGraphemes
str이 M×1 string형 배열이거나 셀형 배열인 경우 newStr은 M×numGraphemes 배열입니다.
M
str이 1×N string형 배열이거나 셀형 배열인 경우 newStr은 1×N×numGraphemes 배열입니다.
N
임의 크기의 string형 배열 또는 셀형 배열의 경우 이 함수는 분할된 문자소를 크기가 1인 첫 번째 후행 차원을 따라서 배치합니다.
R2019a에 개발됨
editDistance | editDistanceSearcher | knnsearch | rangesearch | tokenizedDocument | split
editDistance
editDistanceSearcher
knnsearch
rangesearch
tokenizedDocument
split
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
유럽
아시아 태평양
지역별 지사에 문의