Решение для создания электронной библиотеки от Xerox
Роль библиотеки в современном мире меняется. От классической функции «книгохранилища» библиотеки двигаются к модели публичного информационного центра. Новые задачи требуют новой инфраструктуры и иного интерфейса взаимодействия с читателями. Значительная часть вопросов организации сервисов может быть решена с по мощью внедрения современных информационных технологий.
Решения, которые можно объединить под названием «полнотекстовая электронная библиотека», призваны упростить доступ к информации, в том числе для удалённых читателей, и обеспечить сохранность библиотечных фондов.
Создание полнотекстовой электронной библиотеки требует комплексного подхода. Внедряемое решение должно как минимум обеспечивать решение следующих задач:
- оцифровка печатных изданий;
- распознавание электронных ресурсов;
- атрибутирование электронных ресурсов;
- организация хранения информации;
- обеспечение удобного доступа к информации;
- информационная безопасность электронной библиотеки.
Компания Xerox, обладая многолетним опытом внедрения специализированных программно-аппаратных комплексов для оцифровки, хранения и обеспечения библиотечных ресурсов, разработала и успешно продвигает на рынке решение «Полнотекстовая электронная библиотека» (ПЭБ Xerox).
Решение имеет модульную структуру (архитектура ПЭБ Xerox представлена на рис. 1), что даёт возможность внедрить отдельные его модули с использованием уже существующих систем и оборудования. Важно отметить, что ПЭБ Xerox интегрируется со многими популярными АБИС, в том числе «Ирбис 64».
Рассмотрим потенциальный эффект внедрения данного решения в разрезе каждого из ключевых автоматизируемых процессов.
НАПОЛНЕНИЕ БИБЛИОТЕКИ ЭЛЕКТРОННЫМИ РЕСУРСАМИ
На рынке представлен достаточно широкий ассортимент сканирующего оборудования для перевода книг и документов в электронный вид – от самых простых моделей до промышленных сканеров, максимально автоматизирующих процесс оцифровки.
Преимущества профессиональных книжных и планетарных сканеров не только в высокой скорости сканирования, но и в том, что они позволяют бережно, с минимальными рисками повреждения оригиналов сканировать редкие и ветхие издания, сохраняя уникальные фонды. Кроме того, такие устройства могут сканировать не только книги, но и различные документы, сшитые папки, журналы, подшивки газет без предварительной подготовки и необходимости расшивать документы. В настоящее время в ряде российских библиотек и вузов компанией Xerox успешно внедрены промышленные сканеры семейства Kirtas (рис. 2). Используемая ими вакуумная технология позволяет бережно перелистывать до 3000 страниц в час в автоматическом режиме. При этом не повреждается оригинал и обеспечивается высокая гарантия перелистывания только одной страницы за операцию.
РАСПОЗНАВАНИЕ, АТРИБУТИРОВАНИЕ И РАЗМЕЩЕНИЕ ЭЛЕКТРОННЫХ РЕСУРСОВ
Формирование электронных коллекций не ограничивается одним лишь качественно выполненным сканированием. Для создания полноценного электронного ресурса потребуется распознать отсканированное изображение, чтобы в дальнейшем получить возможность полнотекстового поиска по документу. Кроме того, ресурсу должны быть присвоены определённые атрибуты (шифр, название, имя автора и т.д.), необходимые для его хранения и поиска в базе библиотеки. Очевидно, что при больших объёмах оцифровки потребуется автоматизировать эти процессы с помощью единого программно-аппаратного комплекса. На рис. 3 представлен процесс формирования электронного контента библиотеки с помощью решения ПЭБ Xerox.