РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Семинар РОМИП'2004

Здесь собрана подробная информация о прошедшем в 2004 году семинаре: Результаты и отчеты участников РОМИП'2004 доступны в разделе "Публикации".

Хроника событий

23 февраля 2004
Начало распространения официальных приглашений к участию в семинаре РОМИП'2004
14 апреля 2004
Сформулировано соглашение об участии в семинаре РОМИП.
16 апреля 2004
Начало распространения заданий для дорожек по поиску в Веб-коллекции, фактографическому поиску, поиску и классификации по коллекции нормативных документов.
27 мая 2004
Завершен прием заявок на участие.
На конференции LREC'2004 состоялся доклад о РОМИП.
6 июня 2004
Розданы задания для дорожки классификации по Веб коллекции.
Состоялся доклад о РОМИП на конференции Диалог'2004.
8 июня 2004
Сроки предоставления результатов участниками перенесены на:
  • 15 июня: дорожка поиска по Веб коллекции
  • 20 июня: дорожка поиска по коллекции нормативных документов
  • 25 июня: дорожка поиска фактов в Веб коллекции
  • 30 июня: дорожки классификации Веб-сайтов и нормативных документов
12 июля 2004
Закончен сбор результатов по всем пяти дорожкам.
22 августа 2004
Разосланы результаты оценки для 4-х из 5 дорожек РОМИП (за исключением дорожки по фактографическому поиску). Опубликовано описание официальных оценок РОМИП.
23 августа 2004
Опубликован формат для подготовки статей для трудов РОМИП'2004. Срок сдачи статей - 7 сентября 2004.
8 сентября 2004
Наконец-то завершена оценка по дорожке поиска фактов в Веб коллекции. Результаты оценки разосланы участникам.
15 сентября 2004
Завершен сбор отчетов участников для включения в труды РОМИП'2004.
24 сентября 2004
Опубликована программа очной встречи РОМИП'2004.
Размещена информация для участников семинара.
4 октября 2004
1 октября в городе Пущино Московской области состоялась очная встреча РОМИП'2004 (фото: 1, 2, 3).
16 октября 2004
Слайды от докладов участников на очной встречи РОМИП'2004.

Оргкомитет

  • Михаил Агеев(МГУ, Москва)
  • Павел Браславский (ИМаш УрО РАН, Екатеринбург)
  • Максим Губин (Кодекс, Санкт-Петербург)
  • Борис Добров (УИС РОССИЯ, Москва)
  • Владимир Добрынин (ПМПУ СПбГУ, Санкт-Петербург)
  • Игорь Кураленок (ПМПУ СПбГУ, Санкт-Петербург)
  • Игорь Некрестьянов (мат.мех. СПбГУ, Санкт-Петербург)
  • Екатерина Павлова (НИИИТ. СПбГУ, Санкт-Петербург)
  • Владимир Плешко (Гарант-Парк Интернет, Москва)
  • Илья Сегалович (Яндекс, Москва)
  • Влад Шабанов(Рамблер,Москва)

Участники

  • ML Классификатор 2.0
    ML Классификатор - система с обучением на образцах, использует метод различительных сил и полнотекстовый поиск. При выделении признаков применяется выделение словосочетаний статистическим методом, или при помощи поверхностного синтаксического анализа. Полнотекстовый поиск таких словочетаний в процессе классификации позволяет соблюсти баланс между полнотой, характерной для систем классификации, использующих однословные термины, и точностью, которой отличаются системы со словосочетаниями.

  • mnogoSearch
    Полнофункциональная поисковая система для сайта или группы сайтов.

  • RCO
    В дорожках планируется использовать модули входящие в состав продуктов, а также используемые в проектной деятельности компании "Гарант-Парк-Интернет", связанной с построением информационно-поисковых и информационно-аналитических систем. К базовым технологиям, развиваемым исследовательской группой компании, относятся морфологический анализ, синтактико-семантический анализ, тематическая классификация, фактографический поиск.

  • Sophia
    Исследовательский прототип системы классификации, разработанный совместно факультетом прикладной математики - процессов управления С. Петербургского государственного университета и лабораторией инженерии знаний (NIKEL) университета Ольстера ( University of Ulster, UK).

  • Золушка
    Исследовательский прототип системы классификации Веб ресурсов.

  • ИС "Кодекс"
    Полнотекстовая база данных, предназначенная для создания информационных систем и хранилищ документов. На базе нее созданы информационно-правовый системы "Кодекс" и "Стройэксперт", электронные системы документооборота "Кодекс", ряд заказных систем.

  • Ментал
    Система Ментал использует синтаксический словарь проф. В.А. Тузова и семантический описатель собственной разработки. С текстами произвольной тематики использует гибридный поиск, основанный на средневзвешенном значении соответствия по словам и семантическому значению. С текстами известной тематики использует семантико-логическую модель предметной области (состоящую из описания типов объектов и правил зависимостей) и логический интерпретатор для поиска соответствия.

  • Поисково-аналитическая система "Галактика-Zoom"
    Работа системы основана на составлении и анализе информационного портрета (ИП) выборки документов. ИП представляет собой список языковых инвариантов (слов и словосочетаний), отличающих данную выборку от прочих. ИП используется для решения задач быстрого представления результатов запроса без чтения текстов документов, автоклассификации и автореферирования.

  • Синдбад
    Система классификации текстовой информации "Синдбад" вляется частью общего пакета верификации данных, разработанного в Бюро Интернет Технологий, и представляет собой набор утилит для структуризации и каталогизации текстовой информации, выявления ошибок при отсутствии количественных ограничений на сложность структуры связей, типы данных и их объем.

    Рубрикация осуществляется по набору ключевых слов, связанных отношениями булевой логики с применением частотных словарей и возможностей нечеткого поиска для выявления связей, возникающих между элементами информации за счет совпадения или близости фрагментов исследуемого текста, в т.ч. связей, которые невозможно представить в виде иерархической модели. Помимо контекстной зависимости, для более точной рубрикации используется смысловая близость уже отрубрицированных элементов.

    Система применима для работы с реляционными, иерархическими, сетевыми БД, а также со слабоструктурированными данными: Web-ресурсами, системами документооборота, текстовыми файлами.

  • УИС РОССИЯ (НИВЦ МГУ + АНО ЦИИ)
    В РОМИП 2004 планируется опробовать некоторые технологии, реализованные в составе информационно-поисковой системы "Университетской информационной системы РОССИЯ" (УИС РОССИЯ, http://www.cir.ru), либо планируемые к реализации.
    Информационно-поисковая система УИС РОССИЯ поддерживается совместно лабораторией анализа информационных ресурсов Научно-исследовательского вычислительного центра МГУ (информационные технологии) и АНО Центр информационных исследований (лингвистические ресурсы и технологии).
    УИС РОССИЯ представляет собой программно-аппаратное решение организации коллекции в миллион документов, ориентированное на потребности аналитических служб (использование рубрикаторов, тезауруса, он-лайн анализ результатов запроса, интерактивное уточнение запроса и т.п.)

  • Яндекс.Server 3.2
    Полнотекстовое индексирование и поиск с учетом русской морфологии