Корректная работа с локальной сетью Информационная безопасность Поиск похожих документов Скорость индексации Разграничение прав доступа
 
 Домой   Заказать/Скачать   Продукты   Проекты   Наши Технологии   Сотрудничество   Пресса   О Компании   English 
SoftInform Search Technology - это Ваша власть над информацией.

Публикация в журнале Computerworld

С учетом «похожести»

Валерий Коржов
17.05.2005
Computerworld, #18/2005

SoftInform предлагает инструментарий для поиска данных в корпоративных системах

Если информацию невозможно найти, то она бесполезна. Однако в современных корпоративных системах отыскать нужные данные зачастую непросто, даже при наличии поисковой системы. Отчасти потому, что не удается подобрать ключевое слово, помогающее найти документ. Отчасти из-за размытости информационной базы, в которой могут присутствовать несколько похожих документов. Из нескольких слабо отличающихся копий непросто выбрать именно ту, которая необходима. Для решения такого рода задач компания SoftInform выпустила программный продукт SearchInform.

Суть технологии SearchInform состоит в поиске похожих документов, при котором учитываются не только слова, но и их порядок.

«Мы используем интуитивно понятную метрику ‘похожести’: если из документа выкинуть половину текста, то он будет на 50% похож на исходный документ», — объяснил директор компании Лев Матвеев. При этом технология позволяет определить наличие дублирующих друг друга документов. Признаком дублирования является совпадение текста на 90%. Если документы имеют 50-90% одинакового текста, то они относятся к одной теме. Если обнаружено меньше 2% сходства, то система трактует эти документы как абсолютно разные и не показывает в результатах выдачи. Впрочем, поиск по ключевым словам также реализован в SearchInform, но необходим он только для первичного поиска документов.

Продукт отличает то, что для поиска информации он использует достаточно небольшой размер индекса. Он составляет всего 15-30% проиндексированного объема документов. Механизм индексации может работать на высокой скорости, анализируя 6 Гбайт данных в час. При этом система поиска учитывает морфологию слов и синонимы. Кроме текстовых и Web-документов, SearchInform может считывать информацию в форматах .doc, .rtf и .pdf, а также из архивов сообщений электронной почты.

SearchInform может индексировать не только документы, хранящиеся в файловой системе, но и различные источники данных. При подготовке результатов выдачи выполняется контроль доступа, то есть пользователь не получит ссылку на документ, к которому у него нет прав доступа.

SoftInform выпускает два коробочных продукта: SearchInform Desktop Edition для индексирования локальной файловой системы и SearchInform Corporate Edition, в которой возможен поиск по различным источникам данных в корпоративной информационной системе. Кроме этого, компания будет работать с интеграторами для реализации заказных проектов корпоративного поиска, а также заниматься интеграцией своего поискового механизма в приложения других производителей ПО.

Назад
  
   Пресс-центр
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года. Подробнее...
» Все новости


Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска». iOne.ru   Подробнее...
» Вся пресса
   Информационные материалы
Пример работы с программой SearchInform и демонстрация возможностей технологии SoftInform Search Technology.
» Скачать демо-ролик...(3,2 Мб)

Проблемы поиска информации в крупных информационных системах и решение этих проблем при помощи технологии полнотекстового поиска компании СофтИнформ.
» Скачать презентацию...(1,1 Мб)
   Награды
Награда Best Soft 2005 от PCMagazine
Top rated at BrotherSoft.com
Высшая награда от BrotherSoft.com
Top rated at BrotherSoft.com

Смотреть все награды...
   Партнерская программа
Мы приглашаем Вас присоединиться к нашей партнерской программе. Начните сотрудничать с нами и вы будете получать вознаграждение от каждой проданной с вашей помощью копии SearchInform. Для присоединения к нашей партнерской программе заполните форму.
stretcher