РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Дорожка поиска нечетких дубликатов в коллекции изображений

Дорожка поиска нечетких дубликатов в коллекции изображений

Дорожка посвящена оценке методов поиска дубликатов в коллекции фотографий. Дубликатами считаются фотографии одной и той же сцены или объекта, сделанные в разных условиях, или разного качества. В частности, дубликатами являются фотографии, снятые в разном масштабе или с разных точек, с различиями в фокусном расстоянии, освещении, с незначительными изменениями фона (движение волны в море или листьев на дереве).

Коллекция содержит большое число "естественных" дублей, что отличает рассматриваемую задачу от задачи поиска трансформированных изображений. Примеры "естественных" дубликатов:

Примеры визуально и/или семантически похожих изображений, не являющихся при этом дублями:

Общая процедура проведения дорожки стандартна.

Колллекция

В этом цикле в качестве исходного набора данных используется коллекция нечетких дубликатов изображений, созданная в 2008 году.

Формулировка задания для участвующей системы

Система-участник должна определить имеющиеся группы дублей в коллекции. Допускается, что одно изображение входит в несколько различных групп дублей одновремененно. Ограничений на размеры групп нет, но оцениваться будут только группы из верхушки списка, отсортированного по убыванию размера групп.

Методология оценки

Оценка будет производится независимыми асессорами.

  • постановка задания ассессору:
    выделить все дубликаты заданной фотографии среди множества изображений, которые были отнесены к дубликатам хотя бы одной из участвующих систем.
  • официальные метрики
    • процент ошибок первого рода (false positive rate)
    • процент ошибок второго рода (false negative rate

Форматы данных