«Информационные Ресурсы России» №2, 2009



Н. Каленов, Г. Савин, А. Сотников

Электронная библиотека «Научное наследие России»

Создание электронных библиотек (ЭБ) путем оцифровки печатных изданий является в настоящее время одним из наиболее важных направлений деятельности крупных научных библиотек многих стран мира. Наличие доступной для читателей электронной версии книги позволяет сохранить оригинал, существенно ограничивая его выдачу на руки.
К настоящему моменту в мире осуществляется большое количество международных и национальных проектов по созданию электронных библиотек. Активно ведутся работы по выработке, принятию и поддержке международных стандартов в области формирования электронных информационных фондов и процедур доступа к ним. Довольно полный и системный анализ развития и текущего состояния электронных информационных ресурсов представлен в работе [1].
Программы развития электронных библиотек достаточно активно начали разрабатываться в мире, начиная с 90-х годов прошлого века.
Значительный интерес представляет проект создания Всемирной библиотеки, участниками которого являются национальные библиотеки ряда стран Европы, а также США, Канады, Японии. В основе проекта лежат национальные программы оцифровки, на базе которых создается огромный распределенный информационный ресурс, который должен быть доступен конечным пользователям через глобальную электронную библиотечную систему.
Заслуживает внимания инициатива американской компании Google, анонсировавшей в 2004 году программу перевода в цифровую форму миллионов книг из библиотек ведущих американских университетов и размещения их в сети Интернет. При этом Google самостоятельно формирует список книг, подлежащих оцифровке.
В качестве ответа на данную инициативу Европейский союз предложил проект создания Европейской Электронной библиотеки, в котором принимают участие национальные библиотеки 19 стран-членов ЕС, а отбор произведений для включения в Европейскую Электронную Библиотеку осуществляется с учетом предложений каждого из участников проекта. Тем самым удается избежать проблем «насильственного обезличивания культур».
Учитывая важность формирования электронных библиотек, Российская академия наук приняла в 2006 году целевую научную программу «Создание ЭБ “Научное наследие России”». ЭБ призвана аккумулировать цифровые копии книг, статей, документов, хранящихся в библиотеках, архивах и музеях РАН. В первую очередь акцент сделан на перевод в цифровую форму редких и уникальных изданий, важнейших документов по истории РАН, материалов экспозиционного характера, включая аудио- и видеоматериалы.
Основной целью создания ЭБ является предоставление всем желающим через интернет информации о выдающихся российских ученых, внесших вклад в развитие фундаментальных естественных и гуманитарных наук, с возможностью ознакомления с полными текстами опубликованных ими наиболее значительных работ. Исходя из этой цели, в ЭБ было решено включать не только электронные версии книг, но и развернутые сведения о российских ученых – биографические данные, основные этапы их научной деятельности, разнородную архивную и музейную информацию, отсканированные фотографии, аудио- и видеозаписи, относящиеся к теме научного наследия. Другой целью создания ЭБ является обеспечение сохранности оригиналов изданий, являющихся исторической ценностью, — возможность работы с цифровыми копиями существенно снижает потребности в работе с печатными материалами, а каждая “книговыдача” на руки раритетных изданий сокращает срок их “жизни”. Третьей целью создания ЭБ является включение сведений об ученых и основных результатах их научной деятельности в Единое научное информационное пространство (ЕНИП) РАН [2]. Информационный ресурс ЭБ представляет собой часть общего электронного информационного пространства, формируемого другими держателями информационных фондов (Президентская библиотека им. Б.Н.Ельцина, Научная библиотека МГУ им. Ломоносова, Российская государственная библиотека, Российская национальная библиотека и др.), что предполагает активное с ними сотрудничество в направлении пополнения информационных ресурсов ЭБ из различных российских и зарубежных источников.
На начальном этапе реализации основными задачами Программы были разработка основных принципов формирования ЭБ, технологии сканирования, обработки и предоставления пользователям материалов, включаемых в Библиотеку, а также создание прикладного программного обеспечения, сопровождающего все этапы создания ЭБ.
В основу технологии формирования ЭБ положен принцип распределенного наполнения и централизованной поддержки. Руководство Программой осуществляет Межведомственный суперкомпьютерный центр РАН, осуществляющий вместе с ВЦ РАН и БЕН РАН разработку технологии и программного обеспечения наполнения и поддержки ЭБ. Основными поставщиками информации для загрузки в ЭБ в настоящее время являются центральные академические библиотеки (БАН и БЕН РАН с их отделами в институтах и научных центрах РАН), ИНИОН, Центральный архив РАН с его Санкт-Петербургским филиалом, Геологический музей РАН им. В.И.Вернадского, Институт русской литературы РАН (Пушкинский дом).
В настоящее время почти завершены экспериментальные работы, и наполнение ЭБ ведется в режиме опытной эксплуатации. Наполнение ЭБ осуществляется копиями изданий, которые не подпадают под действие закона о защите авторских прав (в основном это – издания, вышедшие из печати до 1920-го года).
Управление работами по созданию ЭБ осуществляет Совет, в который входят представители организаций-основных участников Программы. Совет определяет критерии отбора материалов для включения в ЭБ, решает принципиальные вопросы построения системы и организации ее функционирования. Наряду с Советом, имеются административная и редакторская группы, а также группа технического сопровождения ЭБ.
Технологически работа системы строится следующим образом. Каждый участник отбирает издания, соответствующие согласованным критериям (время издания, тематика, авторы), подлежащие, с его точки зрения, сканированию, и предлагает их административной группе, которая может утвердить (зарегистрировать) или отклонить предложения. Зарегистрированные издания сканирует предложивший их участник, дополняет оцифрованный (без распознавания текста) материал необходимыми библиографическими данными, вводя их в базу данных, поддерживаемую на специальном диспетчерском сервере; формирует в текстовом виде оглавление, связывает его при помощи специальных программных средств с оцифрованными страницами и передает электронное издание в редакторскую группу. Редакторская группа проверяет качество подготовленного материала и, используя специальные программные средства, загружает на сервер ЭБ отсканированное издание и его оглавление, а также перегружает с диспетчерского сервера соответствующее библиографическое описание и данные об авторе.
Технология взаимодействия участников системы в процессе наполнения ЭБ изложена в [3, 4], поэтому подробно останавливаться на ней мы не будем. Необходимо отметить лишь, что в системе предусмотрена достаточно четкая диспетчеризация этапов работы с изданиями. Вся метаинформация, циркулирующая в системе (сведения об ученых и изданиях, фотографии, этапы выполнения технологических операций), вводится в базу данных, поддерживаемую на диспетчерском сервере БЕН РАН, с помощью специальных программных средств, разработанных ее сотрудниками. Работа с базой данных осуществляется через стандартные браузеры интернета, поэтому подключение дополнительных участников не требует никакой настройки ни пользовательских компьютеров, ни сервера за исключением присвоения новому участнику логина и пароля и предоставления соответствующих прав доступа к базе данных.
Каждый авторизованный пользователь, подключенный к диспетчерской системе, имеет свои права на выполнение тех или иных операций, устанавливаемые администратором. Все участники системы имеют права на поиск и просмотр всей информации, введенной в систему; участник, обеспечивающий ввод информации, имеет право редактировать только введенные им же данные; члены административной группы имеют право редактировать только ряд служебных полей, члены редакторской группы обладают полными правами на работу со всей информацией.
В процессе прохождения технологического цикла в диспетчерской системе фиксируется текущее состояние работы с каждым вводимым изданием (выделены следующие этапы: «предложено к сканированию», «зарегистрировано», «в работе», «отсканировано», «сдано»), что позволяет контролировать ход ее выполнения.
Диспетчерская система позволяет получать различного рода справки об информации, подготавливаемой ЭБ (как по ученым, так и по публикациям), справки о текущем состоянии процессов обработки конкретного издания, количественные данные о работе, выполненной тем или иным участником и т.п.
Каждое издание, отраженное в ЭБ, перед сканированием индексируется с помощью рубрикатора ГРНТИ.
Сервер (http://nasledie.enip.ras.ru), обеспечивающий опытную демонстрацию ЭБ, поддерживается в МСЦ РАН. Прикладные программные средства для загрузки, поиска и просмотра данных на демонстрационном сервере разработаны специалистами ВЦ РАН и библиотеки (отдела БЕН РАН) Математического института им. В.А.Стеклова. Система позволяет искать информацию об ученых и их публикациях по ряду элементов данных, в том числе по индексам подключенного к системе ГРНТИ, просматривать найденную информацию, в том числе читать полные тексты книг, включенных в ЭБ, с возможностью перехода от оглавления книги на нужный раздел, а затем на выбранную страницу раздела. Интерфейс системы позволяет увеличивать/уменьшать изображение, поворачивать его в случае текста, представленного в альбомном формате на 90 градусов, выгружать всю книгу или ее отдельные главы в формате pdf.
В настоящее время для загрузки в ЭБ подготовлена разнородная информация о более чем 450-ти российских ученых преимущественно 18-19–го веков и оцифровано более 4000 их книг.

Литература:
1. Антопольский А.Б. Зарубежные и российские ресурсы в сфере научного наследия и основные принципы создания электронной библиотеки «Научное наследие России» // Новые технологии в информационном обеспечении науки. Cб. науч. тр. – М.: Научный Мир, 2007. – С.21-39.
2. Бездушный А.А., Бездушный А.Н., Жижченко А.Б., Калёнов Н.Е., Кулагин М.В., Серебряков В.А. Предложения по наборам метаданных для научных информационных ресурсов ЕНИП РАН // Сборник докладов Шестой Всероссийской конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - RCDL’2004, с. 277-284, Пущино, 2004.
3. Калёнов Н.Е., Савин Г.И., Сотников А.Н. Электронная библиотека “Научное наследие России”: технология наполнения // Новые технологии в информационном обеспечении науки. Cб. науч. тр. – М.: Научный Мир, 2007. – С.40-48.
4. Каленов Н.Е., Савин Г.И., Сотников А.Н. Технология создания электронной библиотеки «Научное наследие России» // Научная книга на постсоветском пространстве: материалы II Международной конференции (Москва, 19-21 сентября 2007 г.) / Международная ассоциация академий наук. – М.: Наука, 2007. - С. 11-16.