전체 글 36

[3-2] Decoder의 역할

3. Decoder의 역할 모델의 전체 구조 이미지를 입력으로 받으면, Backbone을 통해서 Visual Feature를 추출. 추출된 Feature는 보통 입력 이미지보다 작은 크기를 가지고 있어서 추후 활용에 용이. 이후 풀고자하는 task에 따라 여러 가지 Decoder를 붙임. Decoder는 앞서 추출한 feature를 이용하여 풀고자하는 vision task에 맞는 결과를 추출함. Classification Backbone 옆 ( B x C x W x H) 의 의미 Visual feature의 tensor 크기 W와 H는 각각 높이와 넓이, C는 channel, B는 Batch size B개의 이미지에 대해서 Visual Feature를 추출했고, 추출한 Visual Feature는 C x..

카테고리 없음 2024.02.01

[3-1] CV 모델 구조 이해

1. Backbone의 의미 Visual Feature 눈으로 감지할 수 있는 시각적 특징을 통해 많은 정보를 얻고 스스로 판단 근거로 활용. Visual Feature in Computer Vision 컴퓨터 비전 task (classification, detection, segmentation, · · · )를 해결할 때 필요한 이미지의 특성을 담고 있는 정보들을 지칭함. Backbone의 역할 Backbone은 이미지에서 중요한 Feature를 추출(extract)할 수 있도록 훈련됨. 즉, Backbone의 역할은 주어진 비전 task를 잘 수행할 수 있는 압축된 Visual Feature를 산출하는 것. Backbone의 구조 여러 개의 Layer로 이루어짐. Layer는 다양한 종류의 feat..

[LaTex] 티스토리 수식 입력

How to do it? 설정 > 꾸미기 > 스킨 편집 > 'html 편집' 클릭 아래의 코드를 사이에 넣어준다. ​ 설정 > 꾸미기 > 모바일 > 모바일 꾸미기 설정 > '티스토리 모바일 웹 자동 연결을 [사용하지 않습니다.]' 이렇게 해야 모바일에서 접속했을 때에도 수식이 깨지지 않는다. 수식 적용 글쓰기에서 수식 앞뒤로 $를 붙여준다. $\tan ^{-1}\left( \dfrac{G_{x}}{G_{y}}\right)$ LaTeX 변환 사이트 수식을 마우스로 직접 작성하고, convert를 클릭하면 우측 상단 LaTex에 LaTex 코드가 나온다. math webdemo.myscript.com 가장 많이 사용하는 사이트는 아래와 같다. Equation Editor for online mathemati..

Tips 2024.01.31

[2-2] 고전 컴퓨터 비전 심화

1. Contour Detection Contour 같은 색깔 및 intensity를 가지는 연속적인 경계점들로 이루어진 curve. 즉, 물체의 경계들. 고전 컴퓨터 비전을 활용하여 raw image에서 객체의 contour를 추출. 중요성 딥러닝 모델은 다량의 학습 데이터가 필요. 다만 이런 데이터를 만들 때, 딥러닝 모델 만을 사용한다면, 데이터를 만들때 사용한 딥러닝 모델의 취약점이 그대로 학습 데이터에 반영될 수 있음. 따라서 딥러닝 모델과 관련없는 고전 컴퓨터 비전 알고리즘을 이용하여 데이터를 가공해야할 경우가 생길 수도 있음. 더불어 고전 컴퓨터 비전 기술은 딥러닝 모델보다 더 작은 하드웨어량의 하드웨어로 구동이 가능. 아주 많은 양의 데이터를 처리할 때, 비용적인 측면에서 유리할 수 있음...

[2-1] 고전 컴퓨터 비전

1. 고전 컴퓨터 비전이란? 고전 컴퓨터 비전 규칙 기반의 이미지 처리 알고리즘 (e.g. OpenCV) 고전 컴퓨터 비전은 주어진 입력에 따라서 내가 원하는 출력 행태가 있었음. 이것을 이루기 위해 사람이 중간 연산 과정 혹은 프로그램들을 손수 만드는 패러다임을 일컬음. 딥러닝 컴퓨터 비전 데이터 학습 기반의 이미지 처리. 입력에서 원하는 출력을 정의하고 출력과의 오차를 줄이는 방향으로 중간에 학습 가능한 DNN을 계속 업데이트함. 학습이 끝난 DNN에 이미지를 넣어주면 별도에 복잡한 프로그램을 사람이 일일이 만들지 않아도 원하는 형태의 출력을 얻을 수 방식. 고전 컴퓨터 비전 활용 딥러닝으로 해결하기 어려운 문제에 활용 (e.g. 로보틱스, 가상현실) 딥러닝 모델 결과의 후처리 딥러닝 모델 없이 데이..

[1] Computer Vision 이란?

01 Computer Vision 정의 Vision 시각적인 정보들의 집합 (ex 사진, 비디오 ㆍ ㆍ ㆍ) 즉, 시각으로 보이는 것을 숫자로 데이터화 하여 저장한 모든 것들을 포함하는 개념 Images are fundamentally, tensors Computer Vision AI의 한 종류로, Vision 데이터들에서 의미있는 정보를 추출하고 이를 이해한 것을 바탕으로 여러가지 작업을 수행하는 것 Computer Vision vs Computer Graphics 기술 발달에 따라 차이가 거의 없어짐. Computer Graphics 컴퓨터 모델을 활용하여 이미지를 렌더링 하는 과정 Types of Computer Vision Transfer Method [ Low-level / Image Proce..

[프로젝트 4] Team 마이너스 회고록

0. Prologue설레는 첫 프로젝트 회고록이다. 조금씩 기록하는 습관을 이번 기회를 통해 가져보려한다. Team 마이너스는 두 번째 프로젝트부터 같은 팀원들과 지금의 4번째 프로젝트까지 함께 했다.  2번째 프로젝트때 우리 Team의 이름은 "URSA. 우루사." 였다. 간 과 관련된 EDA를 했었다. 해당 EDA와 관련된 내용들도 향후 올려놓도록 하겠다. 우리 팀은 정말 신기한 사람들이 모였다. 서로 부족한 점을 돌봐준다. 그렇다보니 모든 부분에서 골고루 좋은 성과를 내게 된다. 정리를 잘하는 사람도 있고, 보통 보이지 않는 부분을 집요하게 들춰내는 사람도 있고, 우리 모두를 혼자 두지 않고 자꾸만 무언가를 함께하도록 하는 사람도 있다. 그러다보니 하나씩 둘씩 우리도 모르는 사이 서로의 장점을 보고..

[프로젝트 4] Team 마이너스 대회 소개

House Price Prediction | 아파트 실거래가 예측 1. EDA 위치 양질의 일자리, 교통, 학군 그리고 문화시설 등 풍부한 인프라가 많으면 높은 아파트 시세를 만듦. ex) 강남데이터셋 위치 정보 (좌표 X, 좌표 Y)를 어떻게 처리하면 좋을지 고민. 데이터에서 각 구별 가격 대장 아파트 위치를 찾아보기.이상치업거래, 다운거래, 자전거래, 편법증여, 지인 간 특수 거래 등Data 관련'아파트명' 국토교통부 '아파트명' : Null 없음. 아파트 명 개수 7726개대회측 '아파트명' : Null 2126개. 아파트 명 개수 6821개 '아파트명' / '전용면적' 국토교통부 : 36272개'거래금액'  거래금액 25000 이하 : 6435개거래금액 25000 이상 50000 이하 : 1520..

The Purpose Driven Life Day3

Day3 삶의 원동력 내 삶의 목적에 대하여 생각할 점 : 목적을 따라 사는 것은 평화로 가는 길이다. 외울 말씀 : "주께서 심지가 견고한 자를 평강에 평강으로 지키시리니 이는 그가 주를 의뢰함이니이다" (사 26:3) 삶으로 떠나는 질문 : 가족과 친구들은 내 삶의 원동력을 무엇이라고 말하겠는가? 나는 진정 어떤 사람이 되고 싶은가? -> 주님, 삶의 목적에 대한 깊은 묵상을 허락하시니 감사합니다. '오직 하나님을 위한 삶을 살았느냐?' 라고 말하면 솔직히 저는 자신이 없습니다. 그러다보니 요새 지쳐있었습니다. 뭘해도 의욕이 없었습니다. '이게 맞는 걸까? 저게 맞는 걸까?' 근데 그런 고민을 하고 있다보면, 시간이 엄청나게 지나있습니다. 저라는 사람의 시계와 세상의 시계는 갭이 많이 크더군요. 자꾸..