РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Формат представления результатов для дорожки классификации

Результат классификации представляется в виде одного XML файла или нескольких файлов, каждый из которых содержит содержит списки назначенных категорий для некоторого множества классифицируемых сайтов.

XML файл должен иметь следующую структуру:

<taskresult xmlns="http://www.romip.ru/data/common">
  <run>
    <systemID>yellow</systemID>
    <runID>1</runID>
  </run>

  <collectionID>narod.ru</collectionID>
  <tasksetID>narod.ru-classification</tasksetID>

  <result>
    <site name="romip.narod.ru">
      <category>100</category>
    </site>

    <site name="realjunk.narod.ru">
    </site>

    <site name="all-in-one.narod.ru">
      <category>100</category>
      <category>107</category>
      <category>147</category>
    </site>

    ....

 </result>
</taskresult>
Блок run характеризует систему с помощью которой были предоставлены результаты. systemID - идентификатор системы, которые был предоставлен организаторами при регистрации. runID - идентификатор модификации системы, которая использовалась для этого прогона (характеризует параметры эксперимента), - его форма определяется участником самостоятельно.

Блок result собственно описывает к каким темам относятся классифицируемые документы. Для каждого классифицируемого сайта идентификаторы назначенных ему категорий перечисляются в виде списка тегов category, а название сайта указывается, как значение аттрибута name тега site.

Внимание: Для ограничения объема выдаваемых результатов установлен максимальный предел в пять категорий для одного документа.