Электронные ресурсы в вузах: проблемы единого поиска
С каждым годом всё большую долю в комплектовании фондов университетских библиотек приобретают электронные издания. Одним из основных источников электронных изданий являются электронно-библиотечные системы (ЭБС). Однако в процессе их использования становится очевидным, что ни одна ЭБС по своему содержанию не удовлетворяет всем потребностям вузов. Поэтому учебному заведению необходимо подписываться на несколько ЭБС одновременно. Кроме того, нередко вуз создаёт свою собственную электронную библиотеку.
В данной статье рассматривается технология интеграции электронно-библиотечных систем, в том числе электронной библиотеки вуза, с целью создания единой информационно-поисковой системы по фондам библиотеки университета.
Во всех ЭБС поиск устроен по-разному, и возможности его различны. Количество поисковых полей – от двух в ЭБС «Лань» до девяти в IQlib, количество используемых булевых операторов – от одного «И» в «БиблиоТех» до трёх «И, ИЛИ, НЕТ» в ЭБС «Book.ru». Качество морфологического анализа тоже различается в зависимости от используемой системы полнотекстового поиска. В связи с этим для удобства читателей возникает необходимость в разработке единой информационно-поисковой системы как по фонду электронных изданий, имеющихся в университете, так и по фонду электронных изданий, представленных в ЭБС. Наиболее удобным с точки зрения использования и администрирования было бы использовать единую систему ЭБС, в которой централизованно осуществлялись бы функции поиска ресурсов коллекции, контроля доступа, сбора статистики и т.п.
Одним из способов решения обозначенной проблемы может быть использование технологии «Яндекс.Сервер» [1]. Для этого необходимо решить несколько задач:
- выбрать источник данных для индексирования и анализатор содержимого документа;
- определить структуру коллекций «Яндекс.Сервера»;
- разработать схему информационных потоков процесса поиска в электронном каталоге и разработать программные модули для обеспечения его работы.
При решении поставленных задач необходимо учитывать следующие особенности организации поиска в электронном каталоге библиотеки университета:
- возможность ежегодного изменения состава ЭБС;
- обеспечение поиска по заранее определённому перечню ЭБС для различных подразделений, филиалов вуза.
В стандартную поставку «Яндекс.Сервера» входят четыре возможных источника данных:
1) ftds – для индексирования файловых директорий;
2) webds – для индексирования веб-страниц;
3) odbcds – для индексирования данных через интерфейс ODBC;
4) mysqlds – для индексирования баз данных MySQL.
В качестве источника данных был выбран стандартный источник webds. Выбор обусловлен простотой организации документов для представления индексатору и наличием отлаженного механизма для работы с коллекцией университета на основе веб-технологий. В данном случае механизм индексирования работает по принципу «сетевого паука» (робота) [2].
Анализ содержимого документа реализован с помощью xml-парсера [3]. Все атрибуты xml-файлов являются текстовыми. Анализ содержимого производится по следующим полям: название; авторы; тематика; год издания; специальность; кафедра; дисциплина; ключевые слова.
Обязательным полем является поле «название».