 | Введение |
 | Пользовательский интерфейс |
 | Работа с SearchInform |
 | Менеджеры |
|
|
|
|
| Что необходимо для качественного поиска? |
Главная страница программы быстрого полнотекстового поиска информации
« предыдущая страница | следующая страница »
Перед началом работы с поисковой программой необходимо проиндексировать всю информацию, в которой будет осуществляться поиск. Это значит, что следует создать файл индекса, который поисковая программа и будет использовать для осуществления моментального поиска. При создании индекса, указывается физическое пространство, с которого будет читаться информация для индексирования. Разумеется, что если база данных с информацией постоянно обновляется (например, входящая корреспонденция в виде электронных писем), то ее необходимо периодически индексировать, чтобы данные для поисковика были всегда актуальными. Скорость индексации в поисковой системе SearchInform на порядок выше, чем у аналогов. Более того, длительное время может занять лишь само создание индекса (т.е. первая индексация), дальнейшая актуализация индекса осуществляется очень быстро. Итак для создания нового индекса можно воспользовться Менеджером Индексов.
Использование индексов является необходимым условием для поиска в принципе. Однако вряд ли можно сказать, что это достаточное условие для качественного поиска. Для того, чтобы использовать возможности поисковой системы SearchInform по максимуму следует позаботиться о таких вещах как Использование морфологии, Синонимы, Стоп-слова и Важные слова. Остановимся подробнее на каждом из этих понятий.
Использование морфологии является одним из важнейших приемов интеллектуального поиска текста. Ведь использование этого режима позволяет ввести в поисковую строку одно слово, а поиск будет осуществляться по всем его словоформам (например, ложка - ложкой - ложки - ложечка -... и т.п.). Исходя из этого, крайне рекомендуется установка в поисковой системе морфологической базы данных для языка, на котором будет осуществляться поиск. Использование морфологии можно задействовать в Менеджере Индексов.
Синонимы используются для определения слов схожих по смыслу, но отличных по морфологическому составу. Суть заключается в том, чтобы "научить" поисковую программу воспринимать такие слова как одинаковые. Можно привести простейший пример. Скажем, Вы желаете осуществить поиск по фразе "новый автомобиль". Естесственно, что поиск выдаст все варианты документов, где встречается "новый автомобиль", использование морфологии позволит найти еще и такие варианты как, например, "нового автомобиля", "новых автомобилей" и т.п. На этом варианты поиска иссякают. А как же насчет таких вариантов как "новая машина", "свежая тачка" и т.п.? Смысл ведь остается тем же, а написание различное. Использование синонимов позволит поисковой программе SearchInform учитывать все варианты. В результате, эффективность поиска возрастает многократно. Настройка синонимов осуществляется при помощи Менеджера синонимов.
Стоп-слова используются в основном в поиске похожих документов. Фактически стоп-слова - это слова несущие нулевую информационную нагрузку, в основном они используются для связи слов со смысловой нагрузкой между собой в предложениях. Это могут быть разного рода союзы, междометия, иногда глаголы, прилагательные и т.п. Слова из списка стоп-слов не учитываются при поиске, что позволяет более достоверно оценивать информацию и осуществлять действительно смысловой контекстный поиск. По умолчанию список стоп-слов содержит довольно большое количество "бесполезных" слов, но его расширение со стороны пользователя может повышать качество и точность поиска. Единственное, что следует учитывать при заполнении этого списка - главное не перестараться и не внести туда лишних слов. Управление Стоп-словами осуществляется в Менеджере Стоп-слов.
Важные слова - это фактически полная противоположность стоп-словам. Все слова, находящиеся в списке "Важных слов" являются более приоритетными, чем остальные. Опять же эту возможность можно очень эффективно использовать для поиска похожих документов, выделяя приоритетную тематику поиска. Высокий приоритет важных слов проявляется в том, что в случае нахождения документов приблизительно с одним процентом похожести, документы с важными словами будут находиться в списке результатов ближе к первым строкам. Принципиальное отличие применения Важных слов от Стоп-слов заключается в том, что использование последних временно отключить нельзя, а Важные слова можно использовать именно тогда, когда это реально необходимо. Создавать и управлять списками Важных слов в поисковой системе можно с помощью Менеджера Важных слов.
Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса
|
 |