РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Дорожка поиска по Веб коллекции

Это повторение дорожки РОМИП'2003.
Дорожка посвящена оценке методов решения задачи традиционной задаче поиска по Веб. Для этого используется набор данных имитирующий Веб и Веб запросы.

Общая процедура проведения дорожки стандартна.

Сводная информация

  • Набор данных: коллекция narod.ru от РОМИП'2003 (7+ Гб).
    (в набор включаются файлы вида narod.*, так и narod_training.*)
  • Задания: выборка из журналов крупных поисковых систем Рунет (Яндекс и Рамблер)
    (всего 24250, набор включает запросы использованные в РОМИП'2003)
  • Метод оценки: метод "общего котла" (pooling) (глубина пула 50)
  • Шкала оценки релевантности: точно/возможно/вероятно/нет/невозможно оценить
    и да/нет/невозможно оценить
  • Количество оцениваемых заданий: 48 новых и 19 из РОМИП'2003
  • Длина возвращаемых системой ответов на задания: до 100 ссылок
  • Стандартные метрики:
    • точность
    • полнота
    • 11-точечный график TREC
  • Форматы: