공부/단행본

[컴퓨터 비전] Chapter 01 소개

내공얌냠 2022. 2. 11. 13:12

컴퓨터 비전

기본 개념부터 최신 모바일 응용 예까지

오일석 지음

Chapter 01 소개

왜 컴퓨터 비전인가?

영상을 입력하면 자동으로 해석하여 정보를 출력할 수 있게 한다.

컴퓨터 비전 주요 응용 사례

오락, 교통, 보안, 산업, 계산 사진학, 의료, 과학, 농업, 군사, 모바일 

컴퓨터 비전의 문제 해결법

1) 과학적 접근 : 인간의 시각이 어떻게 작동하는지 원리를 밝혀낸 다음 컴퓨터로 모방

2) 공학적 접근 : 주어진 문제를 푸는 알고리즘을 고안

계층적 처리

영상

-> 전처리(영상 처리가 담당, image processing)

-> 특징 추출(feature extraction, 전처리부터 특징추출까지가 저급 비전, low-level vision)

-> 해석(여기가 고급비전, high-level vision)

-> 고급 묘사

문제 해결 도구

- 자료구조와 알고리즘, 수학, 기계 학습

시스템 설계 과정

(성능 만족할 때까지 여러번 피드백)

문제이해

-> 데이터베이스 수집 (learning set/training set, test set, ground truth(알아내야하는 정답))

-> 알고리즘 설계와 구현

-> 성능 평가

전체 : 맞는 샘플 + 틀리는 샘플 + 기각한 샘플수

정인식률(correct recognition rate) = 맞는샘플수/전체,

기각률(rejection rate) = 기각한 샘플수/전체,

오류율(error rate) = 틀린 샘플수/전체

혼동 행렬(confusion matrix)

TP(True Positive, 맞는데 맞게 예측) : 긍정예측을 성공

FN(False Negative, 맞는데 아니라고 예측) : 부정예측을 성공

FP(False Positive, 거짓검출(False Detection), 거짓 정보(False Alarm), 아닌데 맞다고 예측) : 긍정예측을 실패

TN(True Negative, 아닌데 아니라고 예측) : 부정예측을 실패

거짓긍정률 FPR = FP / FP + TN

거짓부정률 FNR = FN / TP + FN

참 긍정률 TPR = TP / TP + FN

참 부정률 TNR = TN / FP + TN

Robust

시스템이 작동하는 외부 환경이 변할 때 성능을 얼마나 잘 유지하는지를 나타냄

인접학문

영상처리: 영상을 입력으로 받아 처리하여 새로운 영상을 출력한다

컴퓨터 그래픽스: 입력된 고급 묘사를 바탕으로 영상을 생성하거나 합성한다, 컴퓨터 비전과 반대 과정으로 볼 수 있음

패턴인식 : 얼굴이나 문자처럼 영상으로 표현된느 패턴과 온갖 종류의 데이터를 패턴으로 간주하고 분석과 분류 작업을 수행한다.

 

 

 

728x90
반응형