컴퓨터비전이란 무엇인가? : Definition of Computer Vision

Computer Vision 이란 무엇인가?

머신비전시스템 (MVS) 은 인간의 눈이나 두뇌의 일부 기능을 모방하기 위해 몇 가지 전자적 하드웨어와 컴퓨터 소프트웨어를 통합한 장치라고 보면 된다. 데이터 처리과정은 이미지 취득 및 수학적 분석과 같이 낮은 수준의 기능과 해석·의사결정 등 높은 수준의 행동으로 나뉜다. ........... (전자신문 2001)

시각처리 과정을 두 단계 나눌 수 있다. 화상처리 단계(image processing stage)는 원래의 화상을 배경 분석 단계에서 이용하기 쉬운 형태로 변형시키는 단계이다. 다양한 필터링(filtering)을 이용해서 노이즈를 줄이고, 간선을 강조하기도 하며, 영역을 발견해내는 등의 여러 가지 작업을 한다. 배경 분석 단계(scene analysis stage) 는 한 단계 처리된 화상으로부터 에이전트가 임무 수행에 필요로 하는 정보 형태를 생성해내는 단계이다. 로봇 시각 분야를 여기서처럼 두 단계로 나누는 것은 단지 설명을 위하여 단순화시킨 것이고, 실제 응용에서는 보다 많은 단계를 거치며 단계간의 상호작용도 훨씬 활발하다. ...... 컴퓨터 시각 분야의 첫 단계는 TV카메라의 광 센서 (optic sensor) 와 같이 빛에 민감한 장치에 물체의 화상을 만드는 것이다. 스테레오 시각(stereo vision)의 경우 두 개 이상의 상이 형성되어 물체의 깊이(depth) 를 알 수 있게 한다. 화상은 카메라가 상을 받아들이는 부분인 렌즈에 의해 원근법적 투사(perspective projection) 방법으로 카메라에 형성된다. 광 센서는 화상을 시간 변화에 영향을 받는 2차원 행렬 형태로 변환시킨다. 이 행렬의 각 원소는 의 값을 갖게 되고, 여기서 는 각 행렬에서의 광 센서 위치를 나타내며 는 시간의 범위를 의미한다 (색깔이 포함된 시각(color vision)의 경우 이런 행렬이 3개가 만들어지고, 세 개의 행렬은 각각 삼원색을 나타낸다). 시각을 통해 반응하는 에이전트는 이 배열을 반드시 자신이 처한 환경을 표현하는 아이콘 형태 또는 자신의 행동을 직접 계산할 수 있는 형태의 특징(feature)으로 바꾸어야 한다.

풍경 속 물체의 화상 윤곽선 (contour) 을 나타내는데 유용한 기술이 두 가지있다. 하나는 화상의 간선(edge)을 탐지하는 기술이다. 화상의 간선은 화상의 강도와 다른 속성들이 급작스럽게 변화하는 화상의 일부분이다. 다른 하나의 기술은 화상을 영역(region)으로 나누는 것이다. 영역은 화상의 강도와 다른 속성들이 점진적으로 변화하는 부분이다. 화상의 간선과 영역간의 경계는 물체와 관련있는 불연속성(discontinuity)에 대응되며 이는 장면에서 화상을 생성하는데 중요한 것이다. .......... (Nils J.Nilsson 1998)

생물체의 시각이든 컴퓨터에 의한 시각이든 시각 작용의 역할은 빛에 의한 영상으로부터 어떠한 정보(information)를 얻어 내는 일이다. 자연 세계의 입체적 광경은 빛으로 전달되어 동물의 망막에 투영되기도 하며, 비디오 카메라의 렌즈 후면에 영상을 맺기도 한다. 그 어느 것이든 공간의 입체적 광경을 평면의 영상으로 투영한다는 데에 공통점이 있다 하겠다. 평면 영상의 패턴으로부터 공간물체의 특성과 물체 사이의 관련성을 추출하여 인식과 판단의 기초 정보로 삼는 일은 동물의 지능이나 컴퓨터의 인공지능에 있어서 중요한 사안이 아닐 수 없다 ............. (김희승 1993)