ЭнергетикаМеталлургияХимия и нефтехимияГорнодобывающая отрасль, угольНефть и газАПК и пищевая промышленностьМашиностроение, производство оборудованияТранспортАвиация, аэрокосмическая индустрияАвто/МотоАудио, видео, бытовая техникаТелекоммуникации, мобильная связьЛегкая промышленностьМебель, лес, деревообработкаСтроительство, стройматериалы, ремонтДругие отрасли
|
|
Вышла новая версия библиотеки анализа текста RCO Semantic Network 2.0
Гарант-Парк-Интернет
|
|
21-01-2003 |
Москва, 21.01.2003.
✐ место для Вашей рекламы
Компания Гарант-Парк-Интернет объявляет о выходе новой версии программного продукта RCO Semantic Network 2.0, который предназначен для автоматического анализа текста. Продукт предназначен для разработчиков информационно-поисковых и аналитических систем и позволяет выявить ключевые понятия документа с их взаимосвязями на основе грамматического и статистического анализа текста, а также получить несколько видов рефератов документа. Продукт поставляется в виде динамической библиотеки (dll) для Windows. Первым пользователем новой версии библиотеки стало одно из подразделений ФАПСИ.
Средства библиотеки RCO Semantic Network позволяют автоматически анализировать содержание текстовых документов, представляя его в форме ассоциативной семантической сети, узлами которой служат значимые понятия-темы, выделенные из текста. Выделение тем происходит путем синтактико-семантического анализа текста, который позволяет выделять различные семантические типы понятий текста. Для последующей обработки результатов используется тезаурус, который отождествляет синонимы и приводит слова к обобщающим понятиям-темам, а также фильтрует общеупотребимую лексику из числа тем. Так, словам “российский”, “россиянин” и “Российская федерация” будет соответствовать тема “Россия”, а слова “концепция” и “развитие”, обладающие общим значением, не выделятся в качестве отдельных тем, но могут образовать тему в сочетании с другими словами, например “концепция развития сельского хозяйства”.
Дополнительно между темами сети устанавливаются ассоциативные связи, которые отражают совместное упоминание тем в тексте и могут использоваться для расширения или уточнения запроса при поиске в информационных массивах, а также выявления информации о различных взаимосвязях между целевыми объектами в аналитических задачах.
Основное отличие новой версии от предшествующей заключается в использовании новых лингвистических алгоритмов, которые не только существенно повысили качество анализа, но и позволили выделять понятия различных семантических категорий, например: наименования организаций, физических лиц, географические названия, действия. Кроме того, библиотека теперь позволяет получать несколько видов реферата текста: общий, по заданной теме или по связи заданных тем.
Область применения RCO Semantic Network охватывает задачи построения информационного портрета документа, тематического индексирования полнотекстовых баз данных, выявления скрытых взаимосвязей между объектами в тексте и другие.
Первым пользователем новой версии продукта стало одно из подразделений ФАПСИ, использующее продукт для автоматической обработки потоков текстовых документов с целью последующей классификации.
С демонстрацией использования библиотеки можно познакомиться на сайте http://demo.rco.ru. На сайте http://www.rco.ru/ можно получить информацию о прочих разработках компании в рамках направления RCO.
ИНФОРМАЦИЯ О RCO
RCO - средства полнотекстового поиска и анализа неструктурированной информации; линейка продуктов для поиска и анализа текстов для Oracle и Microsoft, а также поисковая машина; научно-исследовательская лаборатория RCO Research Group.
Контакт: Печников Александр руководитель департамента маркетинга и PR компания «Гарант-Парк-Интернет» тел.: +7 (095) 930-8958, 930-8959, факс: +7 (095) 930-8814 e-mail: marketing@metric.ru URL: http://www.metric.ru/ , http://www.parking.ru/ , http://www.optimizer.ru/ , http://www.rco.ru/
Опубликовано: 21 января 2003 г.
Ключевые слова: нет
Извините, комментариев пока нет
|