«Информационные Ресурсы России» №4, 2007



Опыт создания полнотекстовых ресурсов научной периодики


В работах по созданию открытой Научной электронной библиотеки в НБУВ (www.nbuv.gov.ua/eb/ep.html), а именно в создании полнотекстовых ресурсов научной периодики, активное участие приняли:
•    Харьковская государственная Академия дизайна и искусств (ХГАДИ),
•    Национальная научная медицинская библиотека Украины (ННМБУ).
Сегодня эти организации продолжают работать над созданием отраслевых электронных библиотек и электронных архивов научной периодики.
С прошлого года эти организации сотрудничают с коммерческой компанией ООО "Специализированный центр БАЛИ", одно из направлений деятельности которой - информационные технологии в науке, образовании, культуре, в частности, технологические решения для создания электронных  информационных ресурсов. Развитие этого направления активно поддерживается Общественной организацией "Украинский центр “Сотрудничество”".
Работы по созданию полнотекстовых ресурсов научной периодики в НБУВ начались в 1998 году с проекта "Национальная электронная библиотека Украины". Первым импульсом к началу работ дали обращения в Центр компьютерных технологий (ЦКТ) нескольких редакций научных изданий с просьбой разместить на сайте НБУВ их электронные архивы. Практически одновременно Высшая аттестационная комиссия Украины передала в НБУВ электронные версии/аналоги авторефератов диссертаций.
В этом же году начались работы по реализации проекта "Национальная система реферирования научной литературы". Силами двух организаций – НБУВ и Института проблем регистрации информации НАН Украины осуществлялось формирование общегосударственной Реферативной базы данных "Украиника научная" и выпуск отраслевых серий  ее аналога –  Украинского реферативного журнала "Джерело".
Для реферативной базы осуществлялось постатейное библиографическое описание и реферирование научных журналов и сборников, а также  авторефератов диссертаций. Поэтому было принято решение использовать реферативную базу в качестве основы поискового аппарата полнотекстовой электронной библиотеки.
Это было наиболее логичное и рациональное решение, при котором максимально эффективно использовались автоматизированные  библиотечные технологии, в том числе такие процессы формирования электронного каталога, как каталогизация и систематизация новых поступлений в библиотеку.
Записи электронного каталога и реферативной базы дополнялись сведениями об электронном документе, формировался его электронный адрес URL. Таким образом, создавался каталог (поисковый аппарат электронной библиотеки) и фонд полнотекстовых электронных документов.
Фактически была реализована модель организации электронной библиотеки с раздельным хранением данных и метаданных:

МОДЕЛЬ ЭБ:      электронные документы  +  внешние метаданные
                    |                    |   
              электронный фонд         поисковый аппарат
                                    |   
            библиографическое описание +аннотации/рефераты.

При такой модели электронной библиотеки метаданные формируются  с использованием технологий АБИС. Использование типового инструментария АБИС для подключения внешних объектов к базам данных позволяет организовать доступ к электронным документам, хранящимся как в локальном, так и в удаленном хранилище электронных документов (фонде).

Комплектование фонда электронных документов в НБУВ осуществляется на договорной основе.

ВИДОВОЙ СОСТАВ ФОНДА электронных документов НБУВ
на февраль 2007 года (всего 48,5 тыс электронных документов):

ФОРМАТЫ ФАЙЛОВ электронных документов:
•    HTML (+JPEG)
•    RTF, DOC (в архивах ZIP, RAR)
•    PDF.

В интерфейсе Поиска поисковыми являются основные элементы библиографического описания. Тексты рефератов также используются для контекстного поиска, что значительно расширяет поисковые возможности и позволяет получить предварительную информацию о найденном документе.
Результаты поиска выводятся на экран в виде библиографического описания документа, снабженного аннотацией или рефератом, систематическими индексами, шифрами хранения печатного аналога, и гипертекстовой ссылкой на электронный документ.
Таким образом, параллельно и в тесном взаимодействии у нас  развиваются 2 направления формирования электронных ресурсов: создается реферативная база и открытая полнотекстовая научная электронная библиотека.
Необходимо сказать, что создание как реферативных, так и полнотекстовых ресурсов – это новые направления деятельности научных библиотек. При этом самыми трудоемкими процессами остаются аналитическая роспись сборников и систематизация публикаций.
Поэтому с самого начала работ стало ясно, что в условиях крайне ограниченных кадровых и финансовых возможностей очевидной является необходимость организации сетевой инфраструктуры для одноразового создания и многоразового и многоаспектного использования электронных ресурсов.
От технологий оцифровки мы отказались сразу в силу трудоемкости работ и фактического отсутствия достаточного количества необходимого оборудования. Было принято решение использовать технологии сбора и обработки электронной информации, которая создается в процессе издательской верстки. Мы организовали коллективную работу с привлечением издательств и издающих организаций.

ОСНОВНЫЕ ОРГАНИЗАЦИОННО-ТЕХНОЛОГИЧЕСКИЕ АСПЕКТЫ ИНФОРМАЦИОННОГО ВЗАИМОДЕЙСТВИЯ:
Технологический принцип:
интеграция издательских, библиотечных и сетевых технологий.
Организационный принцип:
организация информационного взаимодействия субъектов информационной инфраструктуры (авторов научных работ, издательств, издающих организаций, библиотек).
Конечная цель:
формирование открытой научной электронной библиотеки.
При определении приоритетных направлений сотрудничества учитывались основные мотивации участников информационного взаимодействия:
•    заинтересованность авторов и научных изданий в популяризации публикаций;
•    заинтересованность организаций в обмене информационными ресурсами;
•    размещение электронных ресурсов в научной электронной библиотеке;
•    льготное получение информационных услуг.
Финансовая заинтересованность рассматривается как мотивация перспективная. На первом этапе работ отказ от финансовых отношений определялся отсутствием действенного и стабильного механизма финансового поощрения.
Следует добавить, что значимым явился тот факт, что размещение периодических изданий на сайтах крупнейших библиотек является одним из критериев оценки их научной значимости. Сегодня 6 научных периодических изданий, электронные архивы которых размещены в электронном фонде НБУВ, получили онлайновые номера ISSN с соответствующими легитимными адресами от сайта НБУВ.

Сегодня можно утверждать, что в процессе формирования Научной электронной библиотеки подтверждена эффективность выбранных нами технологических решений и приобретен большой опыт в плане развития форм и методов информационного взаимодействия с такими субъектами научной сферы, как авторы научных работ, научные издательства и издающие организации, библиотеки, научно-исследовательские институты, высшие учебные заведения.

На сегодняшний день основными реализованными формами  информационного взаимодействия (в рамках формирования научной электронной библиотеки) являются:
1)    совместное формирование ресурсов,
2)    интеграция ресурсов,
3)    информационный (ресурсный) обмен,
а также  взаимодействие с индивидуальными авторами научных работ.
Указанные формы информационного взаимодействия реализуются в различных сочетаниях с такими видами кооперативных работ, как: внутриведомственная, межведомственная, межотраслевая. Перспективным направлением является международная кооперация.
За весь период работ в экспериментальном режиме мы взаимодействовали с  более 40 организациями различного отраслевого и ведомственного подчинения, в том числе с научно-производственными компаниями, и с 78 наименованиями периодических изданий. 
Несколько слов о технологии работ. Как уже говорилось, изначально технология формирования научной электронной библиотеки была ориентирована на использование информации, которая создается в электронном виде в процессе подготовки научных публикаций в издательствах.
С целью экономии производственных ресурсов при формировании реферативных и полнотекстовых электронных  информационных ресурсов была разработана единая технологическая схема создания, обработки и использования научной электронной информации:

автор — издательство — библиотека —  информационные сети.

Таким образом была организована "цепочка" последовательной передачи и обработки информации с максимальным сокращением доли клавиатурного набора при подготовке ресурсов. Были определены необходимые условия эффективности информационного взаимодействия:
•    ориентир на действующие стандарты и единое форматное обеспечение;
•    использование типовых технологических решений и инструментальных средств;
•    унифицированные процедуры приема/передачи информации и обмена ресурсами.

Технология основана на таких базовых подходах:
•    формализация представления данных и метаданных в соответствии с  издательскими и библиотечными стандартами;
•    использование метода конвертирования данных.

Как указывалось выше, внутрибиблиотечная технология формирования  ресурсов электронной библиотеки базируется на автоматизированной библиотечной технологии обработки входного потока новых поступлений. Схема процесса переставлена на рисунке.

Динамика информационного наполнения ресурсов электронной  библиотеки показана на диаграмме.

Многолетнее плодотворное сотрудничество с наиболее активными партнерами (ХГАДИ и ННМБУ) привело к возникновению 2-х отраслевых проектов, инициированных этими организациями:

•    Проект Харьковской государственной академии дизайна и искусств (по инициативе кафедры физической культуры и спорта) и Национального университета физического воспитания и спорта:

"Научные издания по педагогике, физическому воспитанию и спорту как единая информационная система"

Проектом предусматривается объединение в отраслевую электронную библиотеку  14 основных  специализированных изданий по специальности ВАК "Физическое воспитание и спорт",  в том числе научного электронного специализированного издания "Спортивная наука Украины" (www.nbuv.gov.ua/e-journals/), а также других профильных научных изданий.


•    Проект Национальной научной медицинской библиотеки Украины:

"Создание национального электронного медицинского фонда".

В библиотеке ННМБУ в рамках совместных работ с НБУВ формировалась электронная библиотека с распределенными информационными ресурсами, а именно  с удаленным фондом электронных онлайновых документов. В базы данных ННМБУ, которые формируются и поддерживаются в АБИС ИРБИС, импортировались массивы записей с данными про электронные аналоги авторефератов диссертаций, хранящиеся в фонде электронной библиотеки НБУВ. В числе элементов библиографического описания были переданы Интернет-адреса документов. Доступ к текстам авторефератов осуществлялся через электронный каталог библиотеки в режиме «подключение внешнего объекта».
В 2005 году по приказу Министерства здравоохранения Украины в ННМБУ начались работы по созданию отраслевого электронного фонда с непосредственным участием редакций медицинских периодических изданий.

Оба представленных проекта предусматривают создание электронной библиотеки, ориентированной на развитие интеллектуализированных технологий поиска в текстах электронных документов. При этом дополнительным процессом технологической подготовки ресурсов становится обработка текстов публикаций для задач полнотекстового поиска, что предусматривает внедрение новых автоматизированных технологий.

МОДЕЛЬ ЭБ: 

электронные документы  +  внешние метаданные + индексированные тексты
        |                          |            |   
      электронный фонд                 поисковый аппарат
                                  |       
библиографическое описание +аннотации/рефераты + полнотекстовый поиск

Общий опыт работ упомянутых организаций, единые организационно-технологические подходы к созданию и развитию электронных ресурсов, а также пересечение отраслевых тематик (медицина и медико-биологические исследования в спорте), способствовали возникновению совместного проекта:  
•    "Создание информационно-исследовательской онлайновой системы «Медицина, физическая культура, спорт и проблемы здоровья человека» как элемента единого европейского пространства знаний””. 

Этот проект разрабатывается как международный и предусматривает объединение ресурсов медицинской и спортивной отраслей в единую электронную библиотеку и создание на этой базе образовательных ресурсов и сервисов и исследовательской информационной системы.

Литература:
1.О. Баркова. Формирование электронной библиотеки как направление развития научных коммуникаций // Б-ки нац. акад. наук: пробл. функционирования, тенденции развития. — К.: НБУВ, 2005. — Вып. 3. — С. 123-130.
http://www.nbuv.gov.ua/articles/2005/05bovrnk.html
2. О.В. Баркова. Использование технологических возможностей АБИС для создания распределенной электронной библиотеки (на примере ИРБИС) // Науч. и техн. б-ки. — 2004. — N. 3. — С. 113-120. — То же: // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Тр. конф. / 10-я юбил. междунар. конф. "Крым 2003". — М.: ГПНТБ России, 2003. — Т. 1. — С. 177-180.
http://www.nbuv.gov.ua/articles/crimea/2003/tom1/sec/Doc41.HTML
3. О.В. Баркова. Організація фонду онлайнових документів// Бібл. планета. — 2003. — То же: // Бібл. вісн. — 2003. — N 4. — С. 8-17.
http://www.nbuv.gov.ua/articles/2003/03bo0fod.pdf
4. О.В. Баркова. Онлайновые информационные ресурсы Национальной библиотеки Украины имени В. И. Вернадского: технология формирования // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: 9-я Междунар. конф. "Крым 2002": Материалы конф., 8-16 июня 2002 г., г. Судак. — М., 2002. — Т. 1. — С. 253-257.
http://www.nbuv.gov.ua/articles/crimea/2002/sec4/Doc18.HTML