ResNet: Deep Residual Learning for Image Recognition 리뷰(작성중)

2022. 12. 24. 10:01· 공부/논문
목차
  1. Abstract
  2. Introduction
  3. Related Work
  4. Deep Residual Learning

              : 찾아봐야 함.

Abstract

residual network는 optimize 하기 쉽고, depth를 증가할 수록 accuracy 증가를 얻을 수 있다.

ImageNet 데이터셋으로 152 layers로 진행(VGG Net보다 8배 많은), test set에서 3.57 % error.

CIFAR-10 데이터셋으로 100과 1000 layers로도 진행

Introduction

network depth는 중요한 부분이지만, vanishing/exploding gradients 문제를 가지고 있다.

이 문제는 SGD와 back propagation을 위해 converging을 시작하기 위한 레이어들끼리 있는 네트워크를 가능하게 하는 normalized initialization, intermediate normalization layers에 의해 설명된다.

깊은 네트워크가 convergin을 시작할 때 degradation 문제가 발견된다. 이것은 오버핏 때문이 아니라 레이어를 추가함으로써 높은 training error 가 나오게 한다.

이 논문에서는 deep residual learning framework를 소개함으로써 degradation 문제에 대해 설명한다.

residual mapping

H(x) = F(x) + x

F(x) = H(x) - x

F(x) + x = feedforward neurla networks with shortcut connections

shortcut connections : 레이어 하나 혹은 여러 개를 뛰어넘는 것(skip). 

이런 shortcut connections는 identity mapping으로 구현된다. output은 쌓인 레이어의 output에 더해진다.

ILSVRC 2015 에서 1등해따.

Related Work

Residual Representations

Shortcut Connections:

일부 intermediate layers가 다이렉트로 auxiliary classifiers에 연결하는 것도 있다. inception layer

highway networks는 short connection을 gating functions와 나타내지만 이것은 data-dependent하고 파라미터를 갖고 있고 닫혀있다.  반면에 resnet 의 shortcut은 파라미터가 없고 닫혀있지 않아서 모든 정보가 학습되기 위해 추가적인 residual functions을 통과한다. 추가적으로 highway networks는 엄청나게 증가한 깊이에서 정확도가 높게 나오지 않는다.

Deep Residual Learning

Residual Learning

x : 레이어의 첫번째를 위한 인풋

H(x) : underlying mapping 

residual function F(x) := H(x) - x

origiinal function F(x) + x

 

728x90
반응형

'공부 > 논문' 카테고리의 다른 글

VITS  (0) 2023.01.06
RCNN : Rich feature hierarchies for accurate object detection and semantic segmentation tech report (v5)  (0) 2022.12.24
A Survey on Modern Recommendation System based on Big Data  (0) 2022.11.26
Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs  (0) 2022.04.08
BlazeFace  (0) 2022.03.30
  1. Abstract
  2. Introduction
  3. Related Work
  4. Deep Residual Learning
'공부/논문' 카테고리의 다른 글
  • VITS
  • RCNN : Rich feature hierarchies for accurate object detection and semantic segmentation tech report (v5)
  • A Survey on Modern Recommendation System based on Big Data
  • Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs
내공얌냠
내공얌냠
내공냠냠
내공얌냠
내공냠냠
내공얌냠
전체
오늘
어제
  • 분류 전체보기 (255) N
    • 개발 (113)
      • mediapipe (16)
      • insightface (5)
      • JongjuAR (3)
    • 자료구조 알고리즘 (79)
      • 코딩테스트 (64)
      • 이론 (15)
    • 공부 (54) N
      • 단행본 (8) N
      • 튜토리얼 (19)
      • 논문 (15)
      • 복기 (5)
    • 참여 (5)

블로그 메뉴

  • 홈
  • 태그
  • 미디어로그
  • 위치로그
  • 방명록

공지사항

인기 글

태그

  • 구글 미디어파이프
  • speaker adaptation tts
  • 음성인식 튜토리얼
  • 딥러닝 기반 음성인식 기초
  • 플러터 튜토리얼
  • flutter
  • 컴퓨터 비전 책 추천
  • ios google places api
  • 컴퓨터 비전 기초
  • flutter 행사 후기
  • 컴퓨터 비전
  • postgresql 재설치
  • google mediapipe
  • 플러터
  • mediapipe translate
  • git tutorial
  • vscode 스프링 설치
  • 미디어파이프
  • 머신러닝이란
  • flutter tutorial
  • 테디노트의 랭체인을 활용한 rag 비법노트 기본편
  • postgresql install in mac
  • 테디노트의 랭체인을 활용한 rag 비법노트 기본편 후기
  • mediapipe
  • flutter conference
  • 테디노트 rag 기본편
  • python telegrambot
  • 음성인식 기초
  • flutter 행사
  • 깃 튜토리얼

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
내공얌냠
ResNet: Deep Residual Learning for Image Recognition 리뷰(작성중)
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.