Digital Image

October 6, 2023 6 minute read

아날로그 이미지를 디지털 형식으로 변환. 주로 샘플링과 양자화를 통해 이루어짐

Image Digitization

샘플링 및 양자화를 통한 디지털 영상 생성
- 샘플링: 연속적인 아날로그 영상을 일정간격으로 수치화
- 양자화: 각 새믈의 값을 정해진 수치로 대응

Sampling & Quantization

Convert the continuous sensed data into a digital format
Sampling: Digitizing the coordinate values
Quantization: Digitizing the amplitude values

Sampling and quantization on the 2D sensor array

Sampling

아날로그 신호를 디지털 영상으로 표현하기 위해 샘플링 신호로 추출
공간 생플링
- 픽셀을 하나의 데이터로 표현
시간 샘플링
- 연속적인 시간을 특정 주기의 시간으로 나누어 영상을 취득

Quantization

영상 신호의 진폭 값을 디지털 화
샘플링 된 값을 일정 길이의 비트로 표현

Assume a Digital Image $f(x,y)$

$x,y$ : Discrete coordinates with M rows and N columns
$f(x,y)$ : Value of digital image
Representation of $f(x,y)$

Pixel and Resolution

Pixel

디지털 영상을 구성하는 최소 단위 (화소)

Resolution

영상의 가로 x 세로 값

Spatial resolution
- The smallest discernible detail in an image
- Dots (pixels) per unit distance
- Matrix size is not the spatial resolution
Intensity resolution
- The smallest discernible changes in intensity level

Relationships between pixel

Neighbors of a pixel

Consider a pixel $p$ at coordinates $(x,y)$
- Two horizontal/vertical neighbors $[N_4(p)]$:
  - $(x+1,y),(x-1,y),(x,y+1),(x,y-1)$
- Four diagonal neighbors $[N_D(p)]$:
  - $(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)$
- $N_8(p):~N_4(p) \&\& N_D(p)$

Adjacency

픽셀 간의 인접 관계는 픽셀들이 어떻게 서로 연결되어 있는지를 정의합니다. 이는 객체의 경계를 찾거나, 영역을 세분화(segmentation)하는 데 중요한 역할을 합니다.

4-adjacency: Two pixels $p$ and $q$ are 4-adjacent if $q$ is in the set $N_4(p)$
- $N_4(p)$는 픽셀 $p$ 에 대해 수평 및 수직으로 인접한 픽셀들의 집합을 의미합니다. 즉, 상하좌우로 인접한 픽셀들입니다.
8-adjacency: Two pixels $p$ and $q$ are 8-adjacent if $q$ is in the set $N_8(p)$
- 픽셀 $p$ 에 대해 수평, 수직, 대각선으로 인접한 픽셀들의 집합을 의미합니다. 즉, 상하좌우 및 대각선으로 인접한 픽셀
m-adjacency (mixed adjacency): Two pixels $p$ and $q$ are m-adjacent if
- $q$ is in $N_4(p)$ or
- $q$ is in $N_D(p)$ and the set $N_4(p)\cap N_8(p)$ has no pixels
- 위 두 조건중 하나를 만족해야 한다.
- 일반적으로 대각선으로 인접한 픽셀들의 집합
- 4-adjacency 와 8-adjacency 의 혼합

Digital path (curve)

Sequence of distinct pixels
- E.g., Path from pixel $p$ with coordinates $(x_0,y_0)$ to pixel $q$ with $(x_n,y_n)$
  - $(x_0,y_0),(x_1,y_1),…,(x_n,y_n)
  - $(x_i,y_i)$ and $(x_{i-1},y_{i-1})$ are adjacent
  - Length of the path: $n$
  - Closed path: $(x_0,y_n)=(x_n,y_n)$

Connectives

Connected : Two pixels $p$ and $q$ have a path
- 두 픽셀이 연결되어 있다면, 이들의 경로가 필요하다.
- 이 경로는 일련의 픽셀로 이루어져 있으며, 각각의 연속된 픽셀 쌍은 서로 인접해야 한다.
Connected component: Set of pixels that are connected
- 연결된 픽셀간의 집합으로, 집합 내 모든 픽셀 쌍에 대해 어떤 경로가 존재하면, 그 집합은 연결 성분이라고 한다.
- 연결 성분 내 모든 픽셀은 서로 연결되어 있으며, 성분 외부의 픽셀과는 연결되어 있지 않다.
Connected set(= region): There is only one connected component
- 연결된 픽셀들의 집합을 지칭하며, 이는 일반적으로 영상 내에서 동일한 특성(예: 색상, 강도)을 공유하는 픽셀들로 구성된다.
- “Region”이라는 용어는 종종 연결된 픽셀들의 집합이 동일한 속성이나 특성을 가지고 있음을 의미하는 데 사용됩니다. 예를 들어, 같은 색의 영역이나 같은 질감의 영역 등이 있다.
객체를 식별하고 분리하는 데 사용되며, 특히 영상 분할(image segmentation)과 객체 레이블링(object labeling)에서 중요한 역할을 한다.
연결된 구성 요소를 식별하고 분석하는 알고리즘은 다양하며, 그 중 일부는 깊이 우선 탐색(DFS), 너비 우선 탐색(BFS), 유니온-파인드(Union-Find) 등이 있디.

Region: Connected set

Disjoint : Not adjacent regions
- K개의 분리된(disjoint) 영역들로, 이들 영역은 서로 겹치거나 인접하지 않는다.
Foreground & Background
- suppose $K$ disjoint regions $R_k, k=1,2,…,K$
- $R_u$: Union of all the $K$ regions
  - 모든 $K$ 영역들의 합집합(Union).
- Foreground: $R_u$
  - 모든 관심 영역의 합집합
- Background: $(R_u)^c$
  - $R_u$ 의 여집합(complement)입니다. 즉, 전체 이미지 영역에서 $R_u$ 를 제외한 부분입니다.

Boundary (Border or Contour)

Set of pixels in the region
- That have at least one background neighbor
Consider inner & outer border
- for developing border-following algorithms

Boundary & Edge

Boundary : Closed path & more global concept
- 객체의 외곽선을 형성하는 픽셀들의 집합을 지칭합니다. 바운더리는 객체의 형태와 크기를 나타내는 데 사용되며, 객체 인식과 분할에 중요한 역할을 한다.
- 바운더리 추출은 이미지에서 객체의 외곽을 찾는 과정으로, 이는 엣지 검출을 기반으로 하거나, 세그멘테이션(segmentation) 결과를 기반으로 할 수 있다.
- 바운더리는 객체의 형태를 분석하거나, 객체를 다른 이미지로 오버레이(overlay) 하는 데 사용한다.
Edge : Could from open path via thresholding & more local concept
- 이미지에서 밝기의 급격한 변화가 발생하는 지점을 지칭한다.
- 이 변화는 일반적으로 객체의 경계와 배경 사이, 또는 이미지 내의 두 개의 다른 영역 사이에서 발생
- 엣지 검출은 이러한 밝기의 변화를 찾아내는 과정으로, 이는 대개 그래디언트 계산을 포함한다.
- 엣지는 이미지의 주요 특징을 추출하고 분석하는 데 사용되며, 엣지 검출 알고리즘의 예로는 위에서 언급한 소벨 필터, 라플라시안 필터, 캐니 엣지 검출기 등이 있다.

엣지는 이미지에서 밝기의 변화를, 바운더리는 객체의 외곽을 나타낸다. 엣지는 이미지 전체에서 찾아질 수 있는 반면, 바운더리는 특정 객체의 외곽선에만 국한된다. 또한, 바운더리는 대개 연속된 픽셀의 집합으로, 객체의 형태를 따라간다.

Distance measure

Consider pixels $p,q$ and $s$ with coordinates $(x,y), (u,v)$ and $(w,z)$
Distance function (D):
- $D(p,q)\geq 0(D(p,q)=0 if p=q)$
- $D(p,q) = D(q,p)$
- $D(p,s)\leq D(p,q)+D(q,s)$
Euclidean distance
- $D_e(p,q)=[(x-u)^2+(y-v)^2]^{\frac{1}{2}}$
City-block distance
- $D_4(p,q)=|x-u|+|y-v|$
Chessboard distance
- $D_8(p,q)=\textrm{max}(|x-u|,|y-v|)$

Basic Mathematical tools

Elementwise operation

Pixel-by-Pixel basis

Linear vs. Non-linear operations

Average operation

Average multiple noisy images may yield clear image

Subtraction operation

Multiplication / division operations

Shading correction

Masking

Spatial Operations

Spatial Operations 는 이미지의 픽셀을 다루는 연산이다.

Single-Pixel Operation (단일 픽셀 연산)

Alter the pixel intensity $(x)$ using a transformation function $T:s=T(z)$
- s = 출력 픽셀의 밝기, z = 입력 픽셀의 밝기, T = 변환 함수
목적: 특정 픽셀의 밝기 (intensity) 를 변경한다.
이 연산은 이미지의 각 픽셀의 밝기를 독립적으로 변환. 전체 이미지의 밝기 및 대비 조절.

Neighborhood operations (이웃 픽셀 연산)

Generates a pixel at the same coordinates in an output image
Value of that pixel is determined by a specified operation on the neighborhood of pixels in the input image
목적: 출력 이미지의 특정 픽셀 값을 입력 이미지의 해당 픽섹의 이웃 픽셀의 값을 이용해 결정.
Blur 또는 Edge detection 연산에서 사용

Geometric transformations (기하학적 변환)

사상 (Mapping)

화소들의 배치를 변경할 때, 입력 영상의 좌표에 해당하는 해당 목적 영상의 좌표를 찾아, 화소를 옮기는 과정

순 방향 사상

원본 영상의 좌표를 중심으로 목적 영상의 좌표를 계산하여 화소의 위치를 변환하는 방식
hole 또는 overlap (빈 픽셀) 문제 발생
- hole: 입력 영상의 좌표들로 목적영상의 좌표를 만드는 과정에서 사상되지 않은 화소; 확대 및 회전시 주로 발생
- overlap: 원본 영상의 여러 화소가 목적영상의 한 화소로 사상; 축소할 때 주로 발생

역 방향 사상

목적영상의 좌표를 중심으로 역 변환 계산.
오버랩이나 홀이 발생하지 않는다.
영상 품질이 떨어질 수 있다.

Spatial Transformation of Coordinates (좌표의 공간 변환)

이미지의 픽셀을 이동시키는 것
- T: 변환 행렬, (x,y): 원본 좌표, (x’,y’): 변환된 좌표

Intensity Interpolation (밝기 보간)

일반적으로 영상 확대 시: resolution 확대
공간 변환 후 새로운 좌표에 밝기 값을 할당
공간 변환으로 인해 픽셀이 이동하면, 새로운 위치에서의 픽셀 밝기 값을 결정해야 한다.
이때, 보간법(Interpolation)을 사용하여 주변 픽셀의 밝기 값으로부터 새 픽셀의 밝기 값을 추정합니다.
순방향 사상: 홀이 발생
- 역방향 사상을 통해 홀의 화소를 찾고, 오버랩 되지 않게 화소를 배치

Nearest Neighbor (최근접 이웃)

원리: 변환된 위치에서의 픽셀 값은 원본 이미지에서 가장 가까운 픽셀의 강도 값을 가진다.
특징: 계산 비용이 낮고 간단하지만, 직선 모서리에서 왜곡이 발생할 수 있다.

Bi-linear Interpolation (양선형)

원리: 변환된 위치에서의 픽셀 값은 주변 네 개의 픽셀 강도 값에 가중치를 둔 합으로 계산된다.
$v(x,y)=ax+by+cxy+d$
최근접 이웃 방법에 비해 경계가 부드럽지만, 계산 비용이 더 높다.

Bicubic (양입방)

원리: 변환된 위치에서의 픽셀 값은 주변 열 여섯개의 픽셀 강도 값에 가중치를 둔 합으로 계산된다.
$v(x,y)=\sum_{i=0}^{3}\sum_{j=0}^{3}a_{ij}x^iy^j$
특징: 양선형 방법에 비해 더 부드러운 이미지를 생성하지만, 계산 비용이 가장 크다.

Affine Transformation (어파인 변환)

종류: Scaling (확대/축소), Translation (이동), Rotation (회전), Shearing (기울임)
표현: 동차 좌표 (homogeneous coordinates)를 사용하여 아핀 변환을 표현합니다.
설명: 아핀 변환은 이미지를 선형적으로 변환하고, 이동시키는 연산. 이는 이미지의 기하학적인 형태를 변경하지만, 직선의 평행성은 유지한다.
추가설명: Affine Transform
Rotation

Image registration (이미지 정합)

목적
- 입력 이미지를 기하학적으로 변환하여 참조 이미지와 정렬(등록)된 출력 이미지를 생성한다.
- 이미지간 정량적인 분석과 비교를 수행
- 다양한 상황에서 이미지 간의 기하학적인 관계를 찾아서 이미지를 정렬하는 과정이다.
고려사항
- 기하학적 왜곡
예시
- 다른 이미징 시스템의 이미지
- 동일한 기기로 다른 시간에 촬영된 이미지
절차
1. 특징 추출: 이미지에서 관심 영역이나 점을 찾는다.
2. 특징 매칭: 한 이미지의 특징과 다른 이미지의 특징을 매칭한다.
3. 변환 모델 추정: 매칭된 특징 점들을 기반으로 이미지 간의 기하학적 환계를 추정한다.
4. 이미지 변환과 병합: 추정된 변환 모델을 사용하여 이미지를 정합하고, 필요한 경우 병합한다.

Image Digitization

Sampling & Quantization

Sampling

Quantization

Assume a Digital Image $f(x,y)$

Pixel and Resolution

Pixel

Resolution

Relationships between pixel

Neighbors of a pixel

Adjacency

Digital path (curve)

Connectives

Region: Connected set

Boundary (Border or Contour)

Boundary & Edge

Distance measure

Basic Mathematical tools

Elementwise operation

Linear vs. Non-linear operations

Average operation

Subtraction operation

Multiplication / division operations

Spatial Operations

Single-Pixel Operation (단일 픽셀 연산)

Neighborhood operations (이웃 픽셀 연산)

Geometric transformations (기하학적 변환)

사상 (Mapping)

순 방향 사상

역 방향 사상

Spatial Transformation of Coordinates (좌표의 공간 변환)

Intensity Interpolation (밝기 보간)

Nearest Neighbor (최근접 이웃)

Bi-linear Interpolation (양선형)

Bicubic (양입방)

Affine Transformation (어파인 변환)

Image registration (이미지 정합)

Leave a comment

You may also enjoy

Partial Derivative

Derivative

Mathematics GuideMap

Learning Rate