01 Computer Vision 정의
- Vision
시각적인 정보들의 집합 (ex 사진, 비디오 ㆍ ㆍ ㆍ)
즉, 시각으로 보이는 것을 숫자로 데이터화 하여 저장한 모든 것들을 포함하는 개념
Images are fundamentally, tensors - Computer Vision
AI의 한 종류로, Vision 데이터들에서 의미있는 정보를 추출하고 이를 이해한 것을 바탕으로 여러가지 작업을 수행하는 것
출처 : Upstage 컴퓨터 비전 소개 ppt, 7page - Computer Vision vs Computer Graphics
기술 발달에 따라 차이가 거의 없어짐.
- Computer Graphics
컴퓨터 모델을 활용하여 이미지를 렌더링 하는 과정
- Computer Graphics
- Types of Computer Vision

출처 : Upstage 컴퓨터 비전 소개 ppt, 9page - Transfer Method
- [ Low-level / Image Processing ] Resize
서로 다른 해상도의 이미지를 만드는 연산. 이는 바로 주변에 있는 pixel만 고려하여 연산됨. - [ Low-level / Image Processing ] Color Jitter
이미지의 색깔을 바꾸는 연산. 각 pixel 위치에 RGB 값을 독립적으로 변경. 특정 pixel을 연산할 때, 다른 pixel을 참하지 않음. - [ Low-level / Feature Extraction ] Edge Detection
X, Y에 대해서 Edge를 별도로 뽑고 XY를 합쳐서 정밀하게 엣지를 추출하는 과정 있음.
- Edge
급격한 pixel 값의 변화를 보여주는 image 위치
- Edge
- [ Low-level / Feature Extraction ] Watershed
Low-level feature만 가지고 Segmetation(영상분할)하 기법.
각각 pixel들이 가지고 있는 값의 크기를 참고하여 미지를 여러가지 영역으로 분할함. 다만 이때 각각의 pixel은 이미지에 대한 정보를 거의 가지고 있지 않음.
Watershed 알고리즘 적용시, 작은 영역에 있는 여러 pixel에 작용하는 또다른 여러 Low-level CV 기술들이 사용되기도 함. - [ Mid-level / Images -> Image ] Panorama Stitching
여러 이미지를 이어서 하나의 파노라마 이미지를 만드는 것.
단순하게 붙이는 것으로는 이미지가 이어지지 않기 때문에 별도의 연산이 필요. 따라서 각 이미지 상에서 대응되는 지점을 구하여 해당 관계에 대한 정보를 이용하여 이미지를 합치는 과정이 필요.
여기서 pixel 정보는 더 넓은 범위에서 사용되고 있음을 알 수 있음 - [ Mid-level / Images -> World ] Multi-view Stereo
여러 각도에서의 2D 이미지를 바탕으로 3D 공간상의 사물을 재구성하는 기술.
좌우에서 오는 정보를 바탕으로 깊이를 이해하듯, 여러 각도에서의 2D 이미지를 입력으로 받아 해당 사물의 3D 구조 더 나아가 표면의 질감까지 입혀서 재구성을 해주는 기술.
이때 연산시 Low-level 보다 많이 각 Pixel의 정보를 이용해야함. - [ Mid-level / Images -> World ] Depth Estimation
2D 이미지에서 여러 객체들의 서로 다른 3D 상 깊이를 예측하는 기술.
여기서 pixel 정보는 더 넓은 범위에서 사용되고 있음을 알 수 있음 - [ Mid-level / Images -> World ] LIDAR
LIDAR 센서에서 감지되는 데이터를 자율주행에서 사용되는 기술.
레이저를 발사하고 반사되어 돌아오는 시간과 각도를 측정하여 사물에 대한 정보를 얻는 센서.
이때 얻어지는 정보들을 활용할 때, CV의 Mid-level 기술들이 사용됨. 이를 이용하여 3D 사물을 재구성하기도 함. - [ High-level / Semantics ] Image Classification
하나의 이미지 전체를 입력받아 해당 이미지 전체가 어떤 객인지를 예측하는 기술.
이미지 전체에 대한 정보를 전반적으로 이용하여 어떤 사물인지를 판단하고 있음. 가장 넓은 범위에서 pixel 간의 관계를 이용하고 있음. - [ High-level / Semantics ] Object Detection
이미지에서 객체를 검출하고 검출된 객체가 어떤 클래스에 해당되는지 분류해주는 기술.
이미지 전반에 걸친 정보를 활용함. - [ High-level / Semantics ] Segmentation
이미지 안에 있는 여러가지 객체들을 보다 세밀하게 pixel 단위로 분류하는 기술.
Watershed 같은 고전 컴퓨터 비전 알고리즘으로 Segmentation을 진행하는 경우 주로 Low-level feature만 활용됨. 하지만 최근 발전된 DL 기술들은 이미지 전반에 걸친 정보를 활용하여 객체를 분류하고 있음.
- [ Low-level / Image Processing ] Resize
'Upstage AI Lab > AI 심화학습 : CV' 카테고리의 다른 글
| [14] CV 모델 성능 높이기 (0) | 2024.02.06 |
|---|---|
| [3-1] CV 모델 구조 이해 (0) | 2024.02.01 |
| [2-2] 고전 컴퓨터 비전 심화 (0) | 2024.01.31 |
| [2-1] 고전 컴퓨터 비전 (0) | 2024.01.31 |