РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 2005 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Семинар РОМИП'2005

Здесь собрана подробная информация о прошедшем в 2005 году семинаре: Результаты и отчеты участников РОМИП'2005 доступны в разделе "Публикации".

Хроника событий

16 марта 2005
Начало распространения официальных приглашений к участию в семинаре РОМИП'2005
31 марта 2005
Опубликован список участников РОМИП'2005.
22 апреля 2005
Опубликованы правила дорожек. Начало распространения заданий для них.
28 мая 2005
В связи с техническими причинами был изменен контактный адрес оргкомитета РОМИП. Новый адрес - romip[AT]romip.ru.
3 июня 2005
Состоялся доклад о РОМИП на конференции Диалог'2005.
6 июня 2005
Завершен прием заявок на участие.
11 июня 2005
Сроки предоставления результатов участниками перенесены на:
  • 19 июня: классификация сайтов
  • 19 июня: поиск по нормативной коллекции, поиск по смешанной коллекции,поиск по документу-образцу
  • 19 июня: поиск по Веб, классификация Веб страниц
  • 26 июня: фактографический поиск
  • 2 июля: аннотирование, новостная дорожка
28 июня 2005
В связи c обнаруженной технической ошибкой в новостной коллекции сроки сдачи результатов по новостной дорожке и дорожке фактографического поиска перенесены на 9 июля.
23 июня 2005
Закончен сбор результатов по дорожкам поиска по Веб коллекции, по смешанной коллекции и по документу-образцу, а также по классификации Веб-сайтов.
15 июля 2005
Закончекн сбор результатов по дорожке фактографический поиск по новостной коллекции. Начало оценки дорожек поиска.
1 августа 2005
Закончен сбор результатов по дорожкам аннотрирования, классификации по нормативно-правовой коллекции.
12 августа 2005
Закончен сбор результатов по дорожкам классификации Веб-страниц и Веб-сайтов. Начало оценки дорожек аннотрирования, классификации.
4 сентября 2005
Опубликован формат для подготовки статей для трудов РОМИП'2005. Срок сдачи статей - 15 сентября 2004.
18 сентября 2005
Разосланы результаты оценки для 8-ми из 10 дорожек РОМИП (за исключением дорожек по фактографическому поиску и новостной дорожки).
23 сентября 2005
Разосланы результаты по второй части дорожки фактографического поиска по новостной коллекции (поиск фактов).
24 сентября 2005
Опубликована программа очной встречи РОМИП'2005 в Ярославле, которая проходила совместно с конференцией RCDL'2005.
25 сентября 2005
Завершен сбор отчетов участников для включения в труды РОМИП'2005.
8 октября 2005
Опубликованы слайды очной встречи, которая состоялась в Ярославле 6 октября. Труды РОМИП'2005 выложены в разделе публикации.
18 октября 2005
Опубликованы фотографии с очной встречи семинара РОМИП'2005 в Ярославле.

Оргкомитет

  • Михаил Агеев(МГУ, Москва)
  • Павел Браславский (ИМаш УрО РАН, Екатеринбург)
  • Максим Губин (Кодекс, Санкт-Петербург)
  • Борис Добров (УИС РОССИЯ, Москва)
  • Игорь Кураленок (ПМПУ СПбГУ, Санкт-Петербург)
  • Игорь Некрестьянов (мат.мех СПбГУ, Санкт-Петербург)
  • Владимир Плешко (Гарант-Парк Интернет, Москва)
  • Илья Сегалович (Яндекс, Москва)
  • Влад Шабанов(Рамблер,Москва)

Участники

  • ACK
    Исследовательский проект. В рамках РОМИП'2005 планируется провести апробацию алгоритма уточнения поисковых запросов методом обратной связи по релевантности. В основе алгоритма лежит контекстно-ассоциативная модель текста, учитывающая частоту совместной встречаемости различных терминов в предложениях исследуемых текстов (описание модели и метода уточнения запросов изложено в статье, опубликованной в журнале "Труды МАИ",N18).

  • AStars
    На РОМИП-2005 будет проведено тестировние нескольких алгоритмов, разработанных исследовательской группой Института Системного Анализа РАН.
    Основной упор делался на предварительную обработку текста перед классификацией, в то время как непосредственно для классификации использовались уже проверенные, хорошо известные алгоритмы.

  • Exactus
    Интеллектуальная поисковая система "Exactus" является разработкой Лаборатории Интеллектуальных Технологий и Систем ИСА РАН, а также Исследовательского Центра Искусственного Интеллекта ИПС РАН. В системе применяется метод семантико-синтаксического анализа, основанный на принципах коммуникативно-грамматической школы и использующий неоднородные семантические сети для представления фрагментов ситуаций, описанных в тексте. Кроме того, точность и полнота поиска в системе повышается также за счет: вычисления значимости фрагментов текста, расширения поискового запроса синонимами и сходными по смыслу именными группами, ввода запроса на естественном языке, возможности выбора различных стратегий поиска (профилей поиска) и т. д. Разработка является научно-исследовательской и доведена до стадии исследовательского прототипа.

  • eXtragon
    Система автоматического реферирования использует традиционные подходы для выдел важных предложений из текста на основе следующих параметров:
    - частота встречаемости слова в тексте;
    - графическое оформление слов;
    - положение предложения в документе;
    - "сигнальные" слова и фразы.

  • NNCS
    Компания "Бинейро" представляет макет системы контекстно-зависимой классификации и поиска документов по запросу - "NNСS" (Neural Network Classification & Search). Планируется осуществить тестирование разработанного компанией подхода к представлению документов с использованием рекуррентных нейронных сетей.

  • RCO
    На РОМИП-2005 планируется провести апробацию ряда алгоритмов, разрабатываемых исследовательской группой бизнес-подразделения RCO компании "Гарант-Парк-Интернет". Основное направление деятельности исследовательской группы связано с развитием алгоритмов синтактико-семантического анализа текстов на естественном языке. Среди прикладных задач, решаемых на базе созданных группой алгоритмов, можно выделить построение содержательного портрета текста, поиск упоминаний о персонах и организациях, построение семантической сети текста, поиск и классификация фактов, оценка тональности текста по отношению к объекту.

  • SearchInform
    Технология поиска компании СофтИнформ позволяет осуществлять поиск похожих по содержанию документов в любых объемах данных. Она разработана на основе математической модели анализа структуры документа и выбора похожих слов, предложений и массивов текста. Результатом поиска является вывод максимально похожих на заданный фрагмент текста документов с указанием процента релевантности. Также поддерживается поиск по словам и фразам среди больших объемов неструктурированной информации.

  • Specs
    Исследовательский проект, посвященный созданию системы периодического тематического поиска. В рамках РОМИП-2005 будут рассмотрены вопросы предварительной обработки текста и его представления для классификатора, а также модификации существующих алгоритмов классификации и алгоритмов композиции классификаторов.

  • WHO.Integrum
    Система извлечения информации об объектах и связях между ними ФИО - Должность - Организация (ФДО). В системе используются стандартные общие лингвистические модули (морфологический, синтаксический и фрагментационный анализаторы), настраиваемые модули выделения из текста обозначений типизированных объектов (человек, организация, география и т.п.) и их отождествления по тексту, а также модуль анализа обозначений ситуаций, выраженных предикативной вершиной предложения и его актантами.

  • ДЕКОМ
    Исследовательский прототип системы поиска и классификации правовой информации. Применяется подход на основе построения онтологии предметной области.

  • Золушка
    Исследовательский проект, в рамках которого изучаются несколько задач информационного поиска.

  • Кодекс
    Полнотекстовая база данных, предназначенная для создания информационных систем и хранилищ документов. На базе нее созданы информационно-правовый системы "Кодекс" и "Стройэксперт", электронные системы документооборота "Кодекс", ряд заказных систем.

  • Поиск@Mail.ru

  • Поисково-аналитическая система Галактика-Зум
    Работа системы основана на составлении и анализе информационного портрета (ИП) выборки документов. ИП представляет собой список языковых инвариантов (слов и словосочетаний), отличающих данную выборку от прочих. ИП используется для решения задач быстрого представления результатов запроса без чтения текстов документов, автоклассификации и автореферирования.

  • Синдбад
    Система классификации текстовой информации "Синдбад" представляет собой набор утилит для структуризации и каталогизации текстовой информации, в том числе, классификации данных, связи между которыми невозможно представить в виде иерархической модели.

  • УИС РОССИЯ
    Университетская информационная система РОССИЯ (www.cir.ru, УИС РОССИЯ) - проект, нацеленный на создание информационных ресурсов для гуманитарных исследований. Поддерживается Научно-исследовательским вычислительным центром МГУ им.М.В.Ломоносова (НИВЦ МГУ) и АНО Центр информационных исследований. Для выполонений заданий РОМИП используется информационно-поисковая система УИС РОССИЯ, к которой добавляются новые тестируемые модели и модули.

  • Яндекс

    • Новости: Новостной агрегатор 1.4
    • Классификация: Классификатор 2.0 beta
    • Поиск: Яндекс.Server 3.2.12