« предыдущая статья | Все статьи | следующая »
Технологии поиска
Уникальный поиск похожих
На данный момент многими компаниями ведутся интенсивные разработки в области полнотекстового поиска документов. Уже и скорости вычислений позволяют создавать технологии с различными степенями обработки запроса и огромным количеством дополнительных условий. Да и опыт в создании систем фразового поиска дает разработчикам неоценимую информацию для продвижения дальше. Для создания все более и более совершенных технологий и систем. В частности, одной из самых популярных и известных технологий является все тот же Google. В частности, его функция «similar pages». Использование данной функции показывает пользователю страницы, максимально похожие по своему контенту на заданную. В принципе, эта возможность работает, но четких результатов пока получить не удалось – результаты размыты, релевантность низкая, а иногда технология вообще стопорится и выдает полное отсутствие похожих веб страниц. Скорее всего, это обусловлено все теми же проблемами глобальной сети – хаосом и неструктурированностью информации. Но, прецедент все же есть, поэтому дело создания действительно работающей без сучка без задоринки системы – лишь дело времени. Что касается корпоративных систем обработки и поиска знаний, то тут дело обстоит несколько хуже. Действующие (а не разработанные на бумаге) технологии можно пересчитать по пальцам руки. А уж действительно функционального поиска похожих документов пока не сделал никто из титанов и гуру поисковых технологий. Может быть, за ненадобностью (хватает фразового поиска?), а может быть из-за сложности реализации. Но готовая работающая технология все же есть.
SoftInform Search Technology – технология поиска документов, похожих по своему содержанию на заданный разработана компанией «СофтИнформ» и позволяет осуществлять быстрый и точный поиск похожих по содержания документов в любых объемах данных. Данная технология основана на математической модели анализа структуры документа и выбора похожих слов, словосочетаний и массивов текста. Результатом поиска является вывод максимально похожих на заданный фрагмент текста документов с указанием процента релевантности. В отличие от стандартного фразового поиска, SoftInform Search Technology позволяет избежать предварительного подбора ключевых слов – поиск осуществляется по всему документу в целом. Технология работает с различными источниками информации, которая может содержаться как в текстовых файлах форма txt, doc, rtf, pdf, htm, html, так и в базах данных большинства распространенных информационных систем (Access, MS SQL, Oracle, а также любых СУБД, поддерживающих SQL). В ней также дополнительно присутствуют функции использования списков синонимов и выделения «важных слов», для конкретизации поиска.
SoftInform Search Technology позволяет существенно уменьшить потерю времени на поиск близких по содержанию документов. А также сократить время на обработку дублирующихся данных на стадии занесения информации в архив и формировать подборки документов на заданную тематику. Плюс ко всему, технология компании «СофтИнформ» позволяет обрабатывать данные с очень высокой скоростью даже на обычных офисных компьютерах.
Данная технология – это уже не просто теоретическая разработка. Она испытана и с успехом используется в проекте оказания юридических услуг по телефону «Alfa Lawyers», где крайне критична скорость поиска информации. И она наверняка будет более чем полезна в любой базе знаний, аналитической службе или службе технической поддержки крупной фирмы. Универсальность и эффективность SoftInform Search Technology позволяет решать множество проблем, возникающих в процессе работы с информацией. Это и размытость информационного наполнения (при вводе документа в базу данных можно практически мгновенно определить, новый ли это документ или дублирующий уже содержащийся в базе файл), и анализ схожих документов, уже введенных в базу, и быстрый поиск тематически похожих документов, что экономит время, затрачиваемое на подбор ключевых слов и просмотр ненужных документов.
Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.
« предыдущая статья | Все статьи | следующая »
Конечно, стоимость внедрения SearchInform намного выше цены на коробочный вариант, но именно такой заказная разработка для конкретных целей позволит максимально использовать функции, изначально заложенные в технологию и ПО от СофтИнформ. После получения нами заказа на внедрение проекта на базе SoftInform Search Technology, наши специалисты проведут информационный аудит информационной базы на Вашем предприятии и составят спектр функций будущей системы, максимально упростив ее разработку и развертывание.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса
|