« предыдущая статья | Все статьи | следующая »
Поиск Информации. Взгляд со стороны пользователя
Уникальный поиск похожих
На данный момент многими компаниями ведутся интенсивные разработки в области полнотекстового поиска документов. Уже и скорости вычислений позволяют создавать технологии с различными степенями обработки запроса и огромным количеством дополнительных условий. Да и опыт в создании систем фразового поиска дает разработчикам неоценимую информацию для продвижения дальше. Для создания все более и более совершенных технологий и систем. В частности, одной из самых популярных и известных технологий является все тот же Google . В частности, его функция « similar pages ». Использование данной функции показывает пользователю страницы, максимально похожие по своему контенту на заданную. В принципе, эта возможность работает, но четких результатов пока получить не удалось – результаты размыты, релевантность низкая, а иногда технология вообще стопорится и выдает полное отсутствие похожих веб страниц. Скорее всего, это обусловлено все теми же проблемами глобальной сети – хаосом и неструктурированностью информации. Но, прецедент все же есть, поэтому дело создания действительно работающей без сучка без задоринки системы – лишь дело времени.
Что касается корпоративных систем обработки и поиска знаний, то тут дело обстоит несколько хуже. Действующих (а не разработанных на бумаге) технологий – раз два и обчелся. А уж действительного поиска похожих документов пока не сделал никто из титанов и гуру поисковых технологий. Может быть, за ненадобностью (хватает фразового поиска?), а может быть из-за сложности реализации. Но готовая работающая технология все же есть.
SoftInform Search Technology – технология поиска документов, похожих по своему содержанию на заданный, разработанная компанией «СофтИнформ». Она позволяет осуществлять быстрый и точный поиск похожих по содержания документов в любых объемах данных. Разработана данная технология на основе математической модели анализа структуры документа и выбора похожих слов, словосочетаний и массивов текста. Результатом поиска является вывод максимально похожих на заданный фрагмент текста документов с указанием процента релевантности. В отличие от стандартного фразового поиска, при поиске похожих не требуется заранее подбирать ключевые слова – поиск осуществляется по всему документу в целом. Технология работает с различными источниками информации, которая может содержаться как в текстовых файлах форма txt , doc , rtf , pdf , htm , html , так и в базах данных большинства распространенных информационных систем ( Access , MS SQL , Oracle , а также любых СУБД, поддерживающих SQL ). В ней также дополнительно присутствуют функции использования списков синонимов и выделения «важных слов», для конкретизации поиска.
Технология поиска похожих позволяет существенно уменьшить потерю времени на поиск и повторный просмотр одних и тех же или очень близких по содержанию документов, сократить время на обработку дублирующихся данных на стадии занесения информации в архив и формировать подборки документов на заданную тематику. Плюс ко всему, технология компании «СофтИнформ» далеко не так сильно чувствительна к мощности вычислительной техники как уже существующие и позволяет обрабатывать данные с очень высокой скоростью даже на обычных офисных компьютерах.
Данная технология – это уже не просто теоретическая разработка. Она испытана и с успехом используется в проекте оказания юридических услуг по телефону, где крайне критична скорость поиска информации. И она наверняка будет более чем полезна в любой базе знаний, аналитической службе или службе саппорта крупной фирмы. Универсальность и эффективность SoftInform Search Technology позволяет решать широкий спектр проблем, возникающих в процессе работы с информацией . Это и размытость информационного наполнения ( при вводе документа в базу данных можно практически мгновенно определить, новый ли это документ или дублирующий уже содержащийся в базе файл), и анализ похожестидокументов, которые уже введены в базу, и быстрый поисктематически похожих документов, что сохраняет время, затрачиваемое на подбор ключевых слов и просмотр ненужных документов.
Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.
« предыдущая статья | Все статьи | следующая »
Благодаря такому подходу технологии СофтИнформ без проблем встраиваются поверх уже функционирующих на предприятии информационных систем и позволяют без перестройки всей информационной инфраструктуры предприятия решить проблемы консолидации и поиска информации и различных подсистем. Данная возможность позволяет крайне эффективно внедрить технологии СофтИнформ практически на любом крупном предприятии с минимальными затратами. Безусловно это потребует затрат гораздо больших чем внедрение коробочных решений от СофтИнформ, но и принесет намного больше пользы для предприятия – фактически это заказная разработка новой информационной системы предприятия которая интегрирует все себя все уже существующие на данном предприятии решения.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса
|