native2unicode
숫자형 바이트를 Unicode 문자 표현으로 변환
구문
unicodestr = native2unicode(bytes)
unicodestr = native2unicode(bytes, encoding)
설명
unicodestr = native2unicode(bytes)
는 숫자형 벡터 bytes
를 사용자 디폴트 인코딩에서 Unicode® 문자 표현으로 변환합니다. native2unicode
는 bytes
를 8비트 바이트로 구성된 벡터로 취급하며, 각 값은 [0,255] 범위에 있어야 합니다. 출력 인수 unicodestr
은 bytes
와 동일한 일반적인 배열 형태를 가진 문자형 벡터입니다.
bytes
가 encoding
으로 지정된 문자 인코딩 체계에 있다는 가정하에 unicodestr = native2unicode(bytes, encoding)
은 bytes
를 Unicode 표현으로 변환합니다. 입력 인수 encoding
은 문자가 없거나(''
) 인코딩 체계에 대한 이름 또는 별칭이어야 합니다. 몇 가지 예로 'UTF-8'
'latin1'
, 'US-ASCII'
및 'Shift_JIS'
를 들 수 있습니다. encoding
이 지정되지 않거나 여기에 문자가 포함되어 있지 않으면(''
) 디폴트 인코딩 체계가 사용됩니다. encoding
은 문자형 벡터 또는 string형 스칼라입니다.
참고
bytes
가 문자형 벡터나 string형 스칼라이면 변경되지 않은 채로 반환됩니다.
예제
이 예제는 알 수 없는 문자 인코딩 체계의 바이트로 구성된 벡터를 사용하여 시작합니다. 사용자 작성 함수 detect_encoding
은 인코딩 체계를 확인합니다. 함수가 성공하면 인코딩 체계 이름이나 별칭을 문자형 벡터로 반환합니다. 함수가 실패하면 MException 객체 ME
로 표현되는 오류가 발생합니다. 이 예제는 native2unicode
를 호출하여 바이트를 Unicode 표현으로 변환합니다.
try enc = detect_encoding(bytes); str = native2unicode(bytes, enc); disp(str); catch ME rethrow(ME); end
감지된 인코딩 체계에서 표현하는 언어로 텍스트가 올바르게 표시되도록 컴퓨터가 구성되어 있어야 하며, 이에 의해 disp(str)
의 출력값이 올바르게 표시되어야 합니다.
확장 기능
버전 내역
R2006a 이전에 개발됨