컴퓨터 비전
기본 개념부터 최신 모바일 응용 예까지
오일석 지음
Chapter 01 소개
왜 컴퓨터 비전인가?
영상을 입력하면 자동으로 해석하여 정보를 출력할 수 있게 한다.
컴퓨터 비전 주요 응용 사례
오락, 교통, 보안, 산업, 계산 사진학, 의료, 과학, 농업, 군사, 모바일
컴퓨터 비전의 문제 해결법
1) 과학적 접근 : 인간의 시각이 어떻게 작동하는지 원리를 밝혀낸 다음 컴퓨터로 모방
2) 공학적 접근 : 주어진 문제를 푸는 알고리즘을 고안
계층적 처리
영상
-> 전처리(영상 처리가 담당, image processing)
-> 특징 추출(feature extraction, 전처리부터 특징추출까지가 저급 비전, low-level vision)
-> 해석(여기가 고급비전, high-level vision)
-> 고급 묘사
문제 해결 도구
- 자료구조와 알고리즘, 수학, 기계 학습
시스템 설계 과정
(성능 만족할 때까지 여러번 피드백)
문제이해
-> 데이터베이스 수집 (learning set/training set, test set, ground truth(알아내야하는 정답))
-> 알고리즘 설계와 구현
-> 성능 평가
전체 : 맞는 샘플 + 틀리는 샘플 + 기각한 샘플수
정인식률(correct recognition rate) = 맞는샘플수/전체,
기각률(rejection rate) = 기각한 샘플수/전체,
오류율(error rate) = 틀린 샘플수/전체
혼동 행렬(confusion matrix)
TP(True Positive, 맞는데 맞게 예측) : 긍정예측을 성공
FN(False Negative, 맞는데 아니라고 예측) : 부정예측을 성공
FP(False Positive, 거짓검출(False Detection), 거짓 정보(False Alarm), 아닌데 맞다고 예측) : 긍정예측을 실패
TN(True Negative, 아닌데 아니라고 예측) : 부정예측을 실패
거짓긍정률 FPR = FP / FP + TN
거짓부정률 FNR = FN / TP + FN
참 긍정률 TPR = TP / TP + FN
참 부정률 TNR = TN / FP + TN
Robust
시스템이 작동하는 외부 환경이 변할 때 성능을 얼마나 잘 유지하는지를 나타냄
인접학문
영상처리: 영상을 입력으로 받아 처리하여 새로운 영상을 출력한다
컴퓨터 그래픽스: 입력된 고급 묘사를 바탕으로 영상을 생성하거나 합성한다, 컴퓨터 비전과 반대 과정으로 볼 수 있음
패턴인식 : 얼굴이나 문자처럼 영상으로 표현된느 패턴과 온갖 종류의 데이터를 패턴으로 간주하고 분석과 분류 작업을 수행한다.
'공부 > 단행본' 카테고리의 다른 글
[컴퓨터 비전] Chapter 03 에지 검출 (0) | 2022.02.11 |
---|---|
[컴퓨터 비전] Chapter 02 영상 처리 (0) | 2022.02.11 |
데이터중심의 어플리케이션 설계 2장 (0) | 2022.01.02 |
데이터중심의 어플리케이션 설계 1장 (0) | 2021.12.30 |
데이터 중심 어플리케이션 설계 (0) | 2021.12.30 |