ComputerVision 8

딥러닝 기반 자연어처리 개괄

딥러닝과 자연언어처리 딥러닝 개요 머신러닝과 딥러닝 인간의 노력이 많이 줄어듦. 규칙 기반과 딥러닝 기반 기계 학습 규칙 기반 모델 적은 양의 데이터로 일반화 기능 결론 도출의 논리적 추론 가능 학습에 필요한 데이터가 비교적 적게 필요 이를 제작한 전문가의 실력을 넘어서기 매우 어려움 해당 전문가의 오류를 동일하게 반복 규칙 구축에 많은 시간과 비용 소요 Toy task에 주로 적용되었음 딥러닝 기반 모델 학습에 사용할 데이터의 질이 좋고 양이 많으면 인간의 실력을 넘어설 수 있음 인간이 생각하지 못한 새로운 방법을 사용할 수 있음 기본적으로 많은 데이터가 필요함 논리적 추론이 아닌 귀납적 근사에 의한 결론 생성 결과에 대한 해석의 어려움 규칙 구축에 많은 시간과 비용 소요 딥러닝 모델의 분류 딥러닝 모..

자연언어처리의 시작 : 텍스트 전처리

텍스트 전처리란? 데이터 분석 단계 데이터 사이언스 관점, NLP 관점, CV 관점 모두에서 "전처리"는 중요함 전처리 : 데이터 사이언스 관점 가장 재미없는 파트 전처리 : 데이터 분석에 있어서 가장 오랜 시간이 걸리 일 즉, 가장 오래 걸리면서 가장 재미없지만 중요한 일 "전처리" 데이터 전처리 방법 초거대 인공지능 시대에도 여전히 유요한 데이터 전처리 논문에 의하면 모델 학습 전 시작 후 4단계에서 전처리가 필요함을 확인할 수 있음. 컴퓨터가 텍스트를 이해할 수 있도록 하는 Data Preprocessing 방법 • HTML 태그, 특수문자, 이모티콘 • 정규표현식 • 불용어 (Stopword) • 어간추출(Stemming) • 표제어추출(Lemmatizing) Preprocessing Pipeli..

[3-2] Decoder의 역할

3. Decoder의 역할 모델의 전체 구조 이미지를 입력으로 받으면, Backbone을 통해서 Visual Feature를 추출. 추출된 Feature는 보통 입력 이미지보다 작은 크기를 가지고 있어서 추후 활용에 용이. 이후 풀고자하는 task에 따라 여러 가지 Decoder를 붙임. Decoder는 앞서 추출한 feature를 이용하여 풀고자하는 vision task에 맞는 결과를 추출함. Classification Backbone 옆 ( B x C x W x H) 의 의미 Visual feature의 tensor 크기 W와 H는 각각 높이와 넓이, C는 channel, B는 Batch size B개의 이미지에 대해서 Visual Feature를 추출했고, 추출한 Visual Feature는 C x..

카테고리 없음 2024.02.01

[3-1] CV 모델 구조 이해

1. Backbone의 의미 Visual Feature 눈으로 감지할 수 있는 시각적 특징을 통해 많은 정보를 얻고 스스로 판단 근거로 활용. Visual Feature in Computer Vision 컴퓨터 비전 task (classification, detection, segmentation, · · · )를 해결할 때 필요한 이미지의 특성을 담고 있는 정보들을 지칭함. Backbone의 역할 Backbone은 이미지에서 중요한 Feature를 추출(extract)할 수 있도록 훈련됨. 즉, Backbone의 역할은 주어진 비전 task를 잘 수행할 수 있는 압축된 Visual Feature를 산출하는 것. Backbone의 구조 여러 개의 Layer로 이루어짐. Layer는 다양한 종류의 feat..

[2-2] 고전 컴퓨터 비전 심화

1. Contour Detection Contour 같은 색깔 및 intensity를 가지는 연속적인 경계점들로 이루어진 curve. 즉, 물체의 경계들. 고전 컴퓨터 비전을 활용하여 raw image에서 객체의 contour를 추출. 중요성 딥러닝 모델은 다량의 학습 데이터가 필요. 다만 이런 데이터를 만들 때, 딥러닝 모델 만을 사용한다면, 데이터를 만들때 사용한 딥러닝 모델의 취약점이 그대로 학습 데이터에 반영될 수 있음. 따라서 딥러닝 모델과 관련없는 고전 컴퓨터 비전 알고리즘을 이용하여 데이터를 가공해야할 경우가 생길 수도 있음. 더불어 고전 컴퓨터 비전 기술은 딥러닝 모델보다 더 작은 하드웨어량의 하드웨어로 구동이 가능. 아주 많은 양의 데이터를 처리할 때, 비용적인 측면에서 유리할 수 있음...

[2-1] 고전 컴퓨터 비전

1. 고전 컴퓨터 비전이란? 고전 컴퓨터 비전 규칙 기반의 이미지 처리 알고리즘 (e.g. OpenCV) 고전 컴퓨터 비전은 주어진 입력에 따라서 내가 원하는 출력 행태가 있었음. 이것을 이루기 위해 사람이 중간 연산 과정 혹은 프로그램들을 손수 만드는 패러다임을 일컬음. 딥러닝 컴퓨터 비전 데이터 학습 기반의 이미지 처리. 입력에서 원하는 출력을 정의하고 출력과의 오차를 줄이는 방향으로 중간에 학습 가능한 DNN을 계속 업데이트함. 학습이 끝난 DNN에 이미지를 넣어주면 별도에 복잡한 프로그램을 사람이 일일이 만들지 않아도 원하는 형태의 출력을 얻을 수 방식. 고전 컴퓨터 비전 활용 딥러닝으로 해결하기 어려운 문제에 활용 (e.g. 로보틱스, 가상현실) 딥러닝 모델 결과의 후처리 딥러닝 모델 없이 데이..

[1] Computer Vision 이란?

01 Computer Vision 정의 Vision 시각적인 정보들의 집합 (ex 사진, 비디오 ㆍ ㆍ ㆍ) 즉, 시각으로 보이는 것을 숫자로 데이터화 하여 저장한 모든 것들을 포함하는 개념 Images are fundamentally, tensors Computer Vision AI의 한 종류로, Vision 데이터들에서 의미있는 정보를 추출하고 이를 이해한 것을 바탕으로 여러가지 작업을 수행하는 것 Computer Vision vs Computer Graphics 기술 발달에 따라 차이가 거의 없어짐. Computer Graphics 컴퓨터 모델을 활용하여 이미지를 렌더링 하는 과정 Types of Computer Vision Transfer Method [ Low-level / Image Proce..

01 Introduction

1.1 왜 컴퓨터 비전인가? 1950~1960년대 사람의 시각에 필적하는 컴퓨터 비전 시스템을 만들려는 목표 - 컴퓨터 성능의 미약으로 무모한 목표라는 것을 깨달음. 특수한 환경에서 특수한 임무를 수행하는 시스템을 구현하는 실용적 목표로 전환. 컴퓨터 비전 응용 사례 - 오락 : 사람의 동작을 인식하는 기능은 게임이나 가전을 편하게 제어할 수 있도록 인터페이스로 사용된다. 이런 종류의 인터페이스를 그래픽 사용자 인터페이스 GUI(Graphical User Interface)와 구별하기 위해 자연스런 사용자 인터페이스 NUI(Natural User Interface) 또는 자연스런 인터페이스 NI(Natural Interface)라고 부릅니다. 와 에서와 같이 실사 영상과 컴퓨터 그래픽스로 제작된 영상을 ..