 |

Ермаков А.Е. Извлечение знаний из текста и их обработка: состояние и перспективы
Информационные технологии. - 2009. – N 7.

Статья посвящена анализу достижений в области компьютерной обработки знаний,
содержащихся в текстах на естественном языке. Формулируются актуальные направления
прикладных исследований, связанные с извлечением и обработкой знаний в текстах
Интернета. Описывается экспериментальная система для оценки потребительских свойств
товаров на основании анализа отзывов их потребителей, размещенных в социальной сети
Интернета.

Ермаков А.Е., Плешко В.В. Семантическая интерпретация в системах компьютерного анализа текста
Информационные технологии. - 2009. – N 6.

В статье описывается подход к построению семантического компонента в системах
компьютерного анализа текста на естественном языке. Подход основан на применении
специальных шаблонов к сети синтактико-семантических отношений между словами
текста, которая строится синтаксическим анализатором. Шаблоны определяют способ
интерпретации фрагментов сети в заданные фреймы, с идентификацией участников
ситуаций и их ролей.

Ермаков А.Е., Плешко В.В. Обработка естественно-языковых запросов к поисковой машине на основе их лингвистического анализа
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2009. – Москва, Наука, 2009

Описывается новый способ преобразования запросов на естественном языке в языки запросов поисковых машин, основанный на машинном анализе синтаксических связей между словами и их отображении на соответствующие операторы языка поисковой машины с максимальным сохранением смысла исходного запроса.

Поляков П.Ю., Плешко В.В., Ермаков А.Е. RCO на РОМИП 2009
Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП’2009. (Петрозаводск, 16 сентября 2009г.) – Санкт-Петербург: НУ ЦСИ, 2009

Настоящая работа является отчетом об экспериментах, проведенных в рамках семинара РОМИП 2009 года. Проведены исследования влияния метода рубрикации в задаче классификации web-страниц и сайтов. Также апробирован новый метод преобразования поисковых запросов на коллекции нормативно-правовых документов.

Ермаков А.Е. Автоматизация онтологического инжиниринга в системах извлечения знаний из текста
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2008. – Москва, Наука, 2008

Доклад посвящен вопросам использования онтологий в системах извлечения знаний из
текста. Рассматриваются особенности онтологий, используемых в таких системах.
Предлагается методика автоматизированного построения онтологии, когда термины
предметной области и связи между ними первоначально выделяются при помощи методов
компьютерного анализа текста.

Поляков П.Ю., Плешко В.В. RCO на РОМИП 2008
Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП’2007-2008. (Дубна, 9 октября 2008г.) – Санкт-Петербург: НУ ЦСИ, 2008

Настоящая работа является отчетом об экспериментах, проведенных в рамках семинара РОМИП 2007-2008 годов. Проведены исследования влияния способа отбора терминов в задаче классификации web-страниц и сайтов. Также были проведены эксперименты по кластеризации новостей.

А.Е. Ермаков Автоматическое извлечение фактов из текстов досье: опыт установления анафорических связей
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2007. – Москва, Наука, 2007

Доклад описывает опыт решения задачи автоматического извлечения фактов из текстовых документов особого стиля - досье. Описываются использованные для поиска фактов средства на основе синтаксического анализатора и синтактико-семантических шаблонов. Особое внимание уделяется закономерностям организации дискурса, использованным для установления анафорических связей.

Поляков П.Ю., Плешко В.В. RCO на РОМИП 2006
Российский семинар по Оценке Методов Информационного Поиска. Труды четвертого российского семинара РОМИП’2006. (Суздаль, 19 октября 2006г.) – Санкт-Петербург: НУ ЦСИ, 2006

Настоящая работа является отчетом об экспериментах, проведенных авторами в рамках цикла семинара РОМИП 2006 года. Проведены исследования различных факторов, влияющих на качество тематической классификации методом опорных векторов. Исследованы различные типы ядра, а также способы отбора классификационных признаков и их взвешивания.

Ермаков А.Е., Киселев С.Л. Лингвистическая модель для компьютерного анализа тональности публикаций СМИ
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2005. – Москва, Наука, 2005

Доклад освещает опыт практического решения задачи определения тональности текста по отношению к заданному объекту. Систематизируются средства, используемые автором текста для формирования тонально окрашенного образа объекта, и строится лингвистическая модель для выделения всех составляющих этого образа. Описывается схема оценки тональности “позитив/негатив” с учетом тех мест, которые занимают в составе пропозиций тональные и нейтральные слова, средства выражения отрицания и инверсии смысла.

Ермаков А.Е. Референция обозначений персон и организаций в русскоязычных текстах СМИ: эмпирические закономерности для компьютерного анализа
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2005. – Москва, Наука, 2005

Доклад посвящен проблемам установления кореферентности обозначений персон и организаций при компьютерном анализе текста. Рассматриваются особенности употребления таких обозначений в тексте СМИ и эмпирические закономерности, с опорой на которые на практике удается провести достаточно достоверный анализ кореферентности. Описывается схема принятия решения при определении референтов, реализованная в программных продукта RCO.
|