Main Content

툴박스에서 제공하는 영상 유형

Image Processing Toolbox™는 여러 가지 기본적인 영상 유형을 정의하며, 아래 표와 같이 요약될 수 있습니다. 이러한 영상 유형이 MATLAB®에서 배열 요소를 픽셀 명암 값으로 해석하는 방식을 결정합니다.

Image Processing Toolbox에서 모든 영상은 비희소(nonsparse) 값을 갖는다고 가정합니다. 숫자형 영상과 논리형 영상은 달리 지정되지 않는 한 실수 값이어야 합니다.

영상 유형

해석

이진 영상

영상 데이터가 m×n 논리형 행렬로 저장됩니다. 행렬의 값은 0과 1이고, 0은 검은색, 1은 흰색으로 해석됩니다. 일부 툴박스 함수는 m×n 숫자형 행렬을 이진 영상으로 해석할 수도 있습니다. 이 경우 0 값은 검은색이고 0이 아닌 모든 값은 흰색입니다.

인덱스 영상

영상 데이터가 m×n 숫자형 행렬로 저장됩니다. 행렬의 요소는 컬러맵에 대한 직접적인 인덱스입니다. 컬러맵의 각 행은 하나의 색에 대한 빨간색, 녹색, 파란색 성분을 지정합니다.

  • single형 또는 double형 배열의 경우 정수 값이 [1, p] 범위에 있습니다.

  • logical형, uint8형 또는 uint16형 배열의 경우 값이 [0, p-1] 범위에 있습니다.

컬러맵은 [0, 1] 범위의 값을 갖는 double형의 c×3 배열입니다.

회색조 영상

(명암 영상이라고도 함)

영상 데이터가 m×n 숫자형 행렬로 저장됩니다. 행렬의 요소는 명암 값을 지정합니다. 가장 작은 값은 검은색을 나타내고 가장 큰 값은 흰색을 나타냅니다.

  • single형 또는 double형 배열의 경우 값이 [0, 1] 범위에 있습니다.

  • uint8형 배열의 경우 값이 [0, 255] 범위에 있습니다.

  • uint16형의 경우 값이 [0, 65535] 범위에 있습니다.

  • int16형의 경우 값이 [-32768, 32767] 범위에 있습니다.

트루컬러 영상

(일반적으로 RGB 영상이라고 함)

영상 데이터가 m×n×3 숫자형 배열로 저장됩니다. 배열의 요소는 3개의 색 채널 중 하나의 명암 값을 지정합니다. RGB 영상의 경우 3개의 채널은 영상의 빨간색, 녹색, 파란색 신호를 나타냅니다.

  • single형 또는 double형 배열의 경우 RGB 값이 [0, 1] 범위에 있습니다.

  • uint8형 배열의 경우 RGB 값이 [0, 255] 범위에 있습니다.

  • uint16형의 경우 RGB 값이 [0, 65535] 범위에 있습니다.

이 외에도 컬러스페이스라 불리는 모델이 있는데, 이 모델은 3개의 색 채널을 사용하여 색을 설명합니다. 이러한 컬러스페이스의 경우 각 데이터형의 범위가 RGB 컬러스페이스의 영상에 허용되는 범위와 다를 수 있습니다. 예를 들어, 데이터형이 double형인 L*a*b* 컬러스페이스에서 픽셀의 값이 음수이거나 1보다 클 수 있습니다. 자세한 내용은 컬러스페이스 및 컬러스페이스 변환 이해하기 항목을 참조하십시오.

HDR(높은 동적 범위) 영상HDR 영상은 회색조 영상처럼 m×n 숫자형 행렬로 저장되거나 RGB 영상처럼 m×n×3 숫자형 배열로 저장됩니다. HDR 영상은 데이터형이 single형 또는 double형이지만 데이터 값의 범위가 [0, 1]로 제한되지 않으며 Inf 값을 포함할 수 있습니다. 자세한 내용은 Work with High Dynamic Range Images 항목을 참조하십시오.
다중분광 영상 및 초분광 영상

영상 데이터가 m×n×c 숫자형 배열로 저장됩니다. 여기서 c는 색 채널의 개수입니다.

레이블 영상

영상 데이터가 m×n categorical형 행렬 또는 음이 아닌 정수로 구성된 숫자형 행렬로 저장됩니다.

이진 영상

이진 영상에서 각 픽셀은 두 개의 이산 값 1 또는 0만 갖습니다. 1과 0 중 하나만 갖습니다. 툴박스에 있는 대부분의 함수가 값이 1인 픽셀을 관심 영역에 속하는 픽셀로 해석하고 값이 0인 픽셀을 배경으로 해석합니다. 이진 영상은 종종 다른 유형의 영상과 함께 사용되어 그 영상에서 처리할 부분을 나타내는 용도로 활용됩니다.

다음 그림은 일부 픽셀 값이 클로즈업된 이진 영상을 보여줍니다.

Binary image in which black pixels are false (0) and white pixels are true (1)

인덱스 영상

인덱스 영상은 영상 행렬과 컬러맵으로 구성됩니다.

컬러맵은 [0, 1] 범위의 값을 갖는 double형의 c×3 행렬입니다. 컬러맵의 각 행은 하나의 색에 대한 빨간색, 녹색, 파란색 성분을 지정합니다.

영상 행렬의 픽셀 값은 컬러맵에 대한 직접적인 인덱스입니다. 따라서 인덱스 영상의 각 픽셀의 색은 영상 행렬의 픽셀 값을 컬러맵의 대응되는 색에 매핑하여 확인됩니다. 매핑은 다음과 같이 영상 행렬의 데이터형에 따라 달라집니다.

  • 영상 행렬의 데이터형이 single형 또는 double형이면 컬러맵은 일반적으로 [1, p] 범위의 정수 값을 포함합니다. 여기서 p는 컬러맵의 길이입니다. 값 1은 컬러맵의 첫 번째 행을, 값 2는 두 번째 행을 가리키는 식으로 매핑됩니다.

  • 영상 행렬의 데이터형이 logical형, uint8형 또는 uint16형이면 컬러맵은 일반적으로 [0, p–1] 범위의 정수 값을 포함합니다. 값 0은 컬러맵의 첫 번째 행을, 값 1는 두 번째 행을 가리키는 식으로 매핑됩니다.

컬러맵은 대개 인덱스 영상과 함께 저장되어, imread 함수를 사용할 때 해당 영상과 함께 자동으로 불러옵니다. 영상과 컬러맵을 작업 공간에 별도의 변수로 읽어 들였다면 영상과 컬러맵 사이의 연결을 계속 관리해 주어야 합니다. 하지만 디폴트 컬러맵만 사용하도록 제한되어 있지 않으며, 사용자가 컬러맵을 선택해서 사용할 수 있습니다.

다음 그림은 각각 인덱스 영상, 영상 행렬, 컬러맵을 보여줍니다. 영상 행렬은 데이터형이 double형이므로 값 7은 컬러맵의 일곱 번째 행을 가리킵니다.

Colored indexed image accompanied by a selection of printed pixel and colormap values

회색조 영상

회색조 영상은 행렬의 값이 하나의 영상 픽셀의 명암을 나타내는 데이터 행렬입니다. 회색조 영상은 컬러맵과 함께 저장되는 경우가 드물지만 MATLAB은 컬러맵을 사용하여 회색조 영상을 표시합니다.

회색조 영상은 각 픽셀의 단일 신호를 획득하는 카메라에서 직접 얻을 수 있습니다. 트루컬러 영상이나 다중분광 영상을 회색조 영상으로 변환하여 영상의 특정 측면을 강조할 수도 있습니다. 예를 들어, RGB 영상의 빨간색, 녹색, 파란색 채널의 선형 결합을 취하여 각 픽셀의 명도, 채도 또는 색상을 나타내는 회색조 영상을 만들 수 있습니다. 트루컬러 영상이나 다중분광 영상의 각 채널을 별도의 회색조 영상으로 분할하여 채널별로 독립적으로 처리할 수 있습니다.

다음 그림은 픽셀 값이 [0, 1] 범위인 double형의 회색조 영상을 보여줍니다.

Grayscale image accompanied by a selection of printed pixel values

트루컬러 영상

트루컬러 영상은 각 픽셀이 3개의 값으로 지정된 색을 갖는 영상입니다. 그래픽스 파일 형식은 트루컬러 영상을 24비트 영상으로 저장하며, 여기서 3개의 색 채널은 각각 8비트입니다. 따라서 1600만 개 색이 생성될 수 있습니다. 실제 영상을 복제하는 수준의 정밀도를 갖기 때문에 트루컬러 영상이라는 용어로 널리 지칭됩니다.

RGB 영상은 가장 일반적인 유형의 트루컬러 영상입니다. RGB 영상에서 3개의 색 채널은 빨간색, 녹색, 파란색입니다. RGB 색 채널에 대한 자세한 내용은 RGB 영상의 분리된 색 채널 표시하기 항목을 참조하십시오.

이 외에도 컬러스페이스라 불리는 모델이 있는데, 이 모델은 3개의 색 채널을 사용하여 색을 설명합니다. 이러한 컬러스페이스의 경우 각 데이터형의 범위가 RGB 컬러스페이스의 영상에 허용되는 범위와 다를 수 있습니다. 예를 들어, 데이터형이 double형인 L*a*b* 컬러스페이스에서 픽셀의 값이 음수이거나 1보다 클 수 있습니다. 자세한 내용은 컬러스페이스 및 컬러스페이스 변환 이해하기 항목을 참조하십시오.

트루컬러 영상은 컬러맵을 사용하지 않습니다. 각 픽셀의 색은 해당 픽셀 위치에서 각 색 채널에 저장된 명암의 조합으로 결정됩니다.

다음 그림은 부동소수점 RGB 영상의 빨간색, 녹색, 파란색 채널을 보여줍니다. 픽셀 값이 [0, 1] 범위에 있는 것을 볼 수 있습니다.

RGB image accompanied by a selection of printed pixel values for the three color channels

(행, 열) 좌표 (2,3)에 있는 픽셀의 색을 확인하려면 벡터 (2,3,:)에 저장된 RGB 3색을 살펴보면 됩니다. (2,3,1)에 값 0.5176이, (2,3,2)에 0.1608이, (2,3,3)에 0.0627이 포함되어 있다고 가정하겠습니다. 이 경우 (2,3) 위치에 있는 픽셀의 색은 다음과 같습니다.

0.5176 0.1608 0.0627

HDR 영상

동적 범위는 밝기 수준의 범위를 가리킵니다. 실제 장면의 동적 범위는 상당히 높을 수 있습니다. HDR(높은 동적 범위) 영상은 32비트 부동소수점 값을 사용하여 각 색 채널을 저장함으로써 실제 장면(장면 기준(Scene-referred)이라고 함)의 전체 색조 범위를 캡처하려고 시도합니다.

다음 그림은 원래 픽셀 값이 [0, 3.2813] 범위에 있는 색조 매핑된 HDR 영상의 빨간색, 녹색, 파란색 채널을 보여줍니다. 색조 매핑은 HDR 영상의 동적 범위를 컴퓨터 모니터나 화면에 필요한 범위로 축소하는 과정입니다.

HDR image accompanied by a selection of printed pixel values for the three color channels

다중분광 영상 및 초분광 영상

다중분광 영상은 4개 이상의 채널을 저장하는 컬러 영상 유형입니다. 예를 들어, 다중분광 영상은 3개의 RGB 색 채널과 3개의 적외선 채널, 총 6개의 채널을 저장할 수 있습니다. 일반적으로 다중분광 영상은 채널 개수가 적습니다. 반면에 초분광 영상은 채널을 수십 개 심지어 수백 개까지 저장할 수 있습니다.

다음 그림은 빨간색, 녹색, 파란색 채널(하나의 RGB 영상으로 표시됨)과 3개의 적외선 채널로 구성된 6개의 채널을 갖는 다중분광 영상을 보여줍니다.

Multispectral image separated into four separate images showing three infrared channels and the RGB channels

레이블 영상

레이블 영상은 각 픽셀이 클래스, 객체 또는 관심 영역(ROI)을 지정하는 영상입니다. 분할 기법을 사용하여 장면의 영상에서 레이블 영상을 도출할 수 있습니다.

  • 숫자형 레이블 영상은 장면에 있는 객체 또는 ROI를 열거합니다. 레이블은 음이 아닌 정수입니다. 일반적으로 배경의 값은 0입니다. 레이블이 1인 픽셀들이 첫 번째 객체를 구성하고, 레이블이 2인 픽셀들이 두 번째 객체를 구성하는 식으로 이루어집니다.

  • categorical형 레이블 영상은 영상에 있는 각 픽셀의 클래스를 지정합니다. 일반적으로 배경에는 <undefined> 값이 할당됩니다.

다음 그림은 petal, leaf, dirt의 3개 범주를 갖는 레이블 영상을 보여줍니다.

Label image accompanied by a selection of printed categorical pixel values

관련 항목