descriptor(기술자)란 무엇인가?

컴퓨터비전/영상처리 2015. 4. 15. 00:28

사진(영상) 에서의 descriptor(기술자)란?


만약 아래 두 사진을 비교한다고 할때 가장 쉽게 생각할 수 있는 방법이 무엇일까요?

아래 두 사진이 같은 사진인지? 아니면 다른 사진인지를 판단하는 방법은 같은 위치에 있는

두 영역(patch)가 모두 같으면 같은 사진일것이고, 다르면 다른 사진일 것 입니다.


       


위와 같이 가장 간단하면서 쉬운 방법은 영상에서의 다양한 위치에 존재하는 patch를 비교하면 

비교 문제를 해결 할 수 있습니다.


영상처리 및 컴퓨터비전에서도 마찬가지로 다양한 부분을 비교하여 많은 부분이 일치하면

동일한 사진이라고 판단하는 방법이 물체의 위치를 찾는데 사용되고 있습니다.


과정은 총 4가지로 이루어져 있습니다.


 1. 두 사진에서 distinctive한 keypoint를 찾습니다. (코너, 에지 등)

 2. 두 사진의 keypoint의 주변을 각각 비교하여 일치 여부를 판단합니다.

 3. 주변 위치가 일치한 keypoint 위치를 쌍으로 homography(호모그래피)를 계산합니다.

 4. 첫번째 이미지의 위치를 두번째 이미지 위치로 조정합니다.



위 사진에서 기술자 함수란 사진에서 특정 영역에 대한 부분을 서로 비교하기 위해

동일한 방법을 통해 사진에서의 특징을 하나의 비교 대상으로 만드는 것을 말합니다.


기술자 함수는 단순하게 영역을 비교하기 위해 설계되어야 하지만 간단한 문제같지만 매우 복잡한

문제일 수도 있습니다. 사진이 회전되었을 경우 혹은 잡음이 섞여 있을 경우, 조명이나 외곡이 있을 경우에도

강건한(robust)한 특징 추출이 가능해야 합니다.


따라서 회전 및 잡음에도 강건한 기술자를 만들기 위해 비교할 좌표(keypoint) 선정에 있어서

코너를 선택하는 경우가 많으며 코너로 부터 기술자를 생성하여 두 이미지를 비교합니다.