«Информационные Ресурсы России» №2, 2008



Я. Шрайберг, Ф. Воройский

Новые подходы к разработке электронных библиотек

Прежде чем говорить о подходах к разработке электронных библиотек (ЭБ) вообще и в библиотеках в частности, целесообразно четко определить, что такое ЭБ. Существует множество определений ЭБ. Часть из них в чем-то согласуются друг с другом, а некоторые находятся в определенном противоречии. Мы склонны остановиться на определении, которое объединяет ряд признаков ЭБ, данных А.И. Земсковым, Я.Л. Шрайбергом и А.Б. Антопольским [1-4]:
«ЭБ — это информационная система, технологически ориентированная на обеспечение доступа пользователей к тематическим коллекциям электронных доку¬ментов (полнотекстовым, изобразительным, звуковым, видео- и мультимедийным), локализованным в са¬мой системе и/или в доступных ей через телекоммуникационные сети во внешних информационных системах».
Другими словами, мы рассматриваем ЭБ, прежде всего, как информационную систему, технологически ориентированную на выполнение ряда функций локального и/или удаленного обслуживания пользователей, в первую очередь, полнотекстовыми документами, а также другими видами ресурсов, перечисленных в приведенном определении. Технологическая ориентированность ЭБ, как видов информационных систем, должна предусматривать реализацию функций, обеспечивающих возможность их использования при решении социальных и профессиональных задач пользователей. К этим функциям, в первую очередь, относятся:
• создание коллекций cобственных локальных, а также распределенных в интернете электронных ресурсов, как по номенклатуре, так и в форме, пригодной для использования в локальной и/или во внешних вычислительных сетях;
• обеспечение этих ресурсов удобным для пользователей и эффективно работающим поисковым аппаратом и навигационной системой;
• обеспечение гибкости управления ресурсами ЭБ персоналом системы;
• сохранение ретроспективы ресурсов в архиве ЭБ и обеспечение доступа к документам архива и др.
Поскольку существующие и создаваемые ЭБ обречены работать в условиях развивающейся и считающейся перспективной на ближайшие годы среды интернета 2, ориентированной преимущественно на Web 2.0, необходимо при их построении учитывать связанные с нею условия. Основными тенденциями, характерными для среды Web 2.0, считаются [5-8]:
• социальная составляющая, позволяющая генерировать и распространять Web-контент на базе открытого децентрализованного взаимодействия в интернете, основанного на правах совместного использования контента;
• наличие семантической разметки документов и переход на XML;
• развитие Web-сервисов и предоставление доступа к данным из любого места и в любое время;
• независимая навигация и управление сайтом, позволяющие пользователям полностью контролировать интерфейс;
• отложенное добавление метаданных, осуществляемое сообществами пользователей;
• полное разделение разработки структуры и дизайна сайтов.
Высказывалось мнение, что в среде Web 2.0 смогут обеспечить себе успех лишь те компании, которые не только научатся строить новые интерфейсы, но и получат в свое распоряжение совместно подготовленные данные, а также:
• будут создавать и использовать недорого масштабируемые сервисы;
• получат контроль над уникальными и сложными для воссоздания источниками данных, которые могут быть обогащены за счет пользователей;
• станут относиться к пользователям как к соразработчикам;
• обеспечат привлечение коллективного разума;
• увеличат охват пользователей за счет обеспечения возможности их самообслуживания;
• разрабатываемое ими ПО не будет привязано к платформе ПК;
• будут создавать упрощенные модели пользовательских интерфейсов и упрощенные бизнес-модели.
Несмотря на отсутствие четкого определения признаков, по которым конкретные сайты могут быть отнесены к классу Web 2.0, в большинстве публикаций [8] такими особенностями считаются:
• использование Web как платформы, а программного обеспечения как сервиса;
• радикальная децентрализация;
• данные являются движущей силой развития;
• наличие масштабируемости в широких пределах;
• признание права пользователей на ремик;
• работа по принципу самообслуживания;
• использование сетевого эффекта , основанного на архитектуре участия ;
• доверие к участникам сообщества;
• инновация в развитии за счет коллективного разума независимых участников;
• наличие ПО для большого спектра устройств;
• обеспечение более структурированного контента, использующего глубокие ссыл¬ки .
Российских создателей и держателей ЭБ не может не заставить задуматься также дальнейшее развитие Web-технологий. Так, на весьма представительной (10 тыс. участников из 57 стран) конференции Web 2.0 Expo, прошедшей в апреле 2007 г. в Сан-Франциско, помимо того, что было представлено значительное число пакетов прикладных программ, архитектурных решений и сервисов, разработанных многими известными компаниями мира в связи с реализацией Web 2.0, был представлен также ряд продуктов так называемого Семантического Веба [Semantic Web], идея которого принадлежит Тиму Бернерсу-Ли. Последняя открывает начало работ, связанных с концепцией Web 3.0 (Веб третьего поколения), особенно активно поддерживаемой организациями военного ведомства США. В ходе конференции Тим О`Рейли (ее организатор и автор концепции Web 2.0) заявил, что нынешние проекты Web 2.0 «…со временем дополнятся средствами понимания естественных языков и улучшенными механизмами поиска на базе алгоритмов искусственного интеллекта и естественным путем перейдут в стадию Web 3.0». В плане создания Web 3.0 начата разработка стандартов RDF и OWL (Web Ontology Language) языков, лежащих в основе Semantic Web и новых сетевых технологий, в том числе связанных со встраиванием семантики в существующие Web-страницы, а также обеспечением RDF-запросов к хранилищам знаний [8-10].
С учетом сказанного, информационные системы, которые призваны поддерживать создание, работу и развитие ЭБ, должны быть соответственно организованными и гибкими для того, чтобы соответствовать своему назначению и обеспечивать возможность адаптации к изменяющимся условиям внешней среды.
По нашему мнению, применительно к условиям создания электронных библиотек в библиотеках, в основе их построения должны лежать так называемые Библиотечные Интернет-комплексы (БИК) [11]. Под БИК понимается программно-техническая и технологическая система, построенная с использованием АБИС и Интернет-технологий, которая обеспечивает решение следующих основных задач:
• предоставление доступа пользователям в локальной и внешней средах к защищенным выполнением условий авторского права [12, 13] полнотекстовым и другим видам информационных ресурсов, которыми располагает библиотека, а также установленным в интернете другими организациями;
• обеспечение современными средствами поиска информации в этих ресурсах;
• построение Интернет-сервера или системы серверов для обеспечения доступа сетевых пользователей к информационным ресурсам своей библиотеки и внешних (не только библиотечных) держателей профильных для нее информационных ресурсов;
• использование возможностей Глобальной сети для совершенствования собственной технологии и технологии межбиблиотечного взаимодействия, а также взаимодействия с небиблиотечными держателями используемых информационных ресурсов;
• вхождение библиотеки в корпоративные или ассоциативные межбиблиотечные и межвидовые информационные системы;
• обеспечение создания и поддержки работы организационно-технологической структуры ЭБ, соответствующей ранее перечисленным задачам.
Поскольку главной особенностью отличающей БИК от других Интернет-комплексов, является организация доступа в первую очередь к информационным ресурсам, генерируемым самой библиотекой, необходимым и определяющим условием построения БИК является наличие АБИС, обеспечивающей создание этих и других ресурсов библиотеки, а также технологическая и техническая опора на нее. Таким образом, реализация БИК как части программно-технологической базы АБИС ставит новые задачи, связанные с их проектированием, включая:
1. разработку и реализацию подсистем «Электронная библиотека», оборудованных соответствующими решаемым в них задачам программно-аппаратными и технологическими комплексами — БИК;
2. внесение в работу библиотек, поддерживающих ЭБ, существенных организационных и технологических изменений. Они связаны с необходимостью:
• выделения в их рамках специальной структуры, ответственной за все виды работ по формированию информационных ресурсов ЭБ, а также поддержку, предоставление в доступ, сохранение и использование этих ресурсов;
• наращивание программно-аппаратной базы АБИС, необходимой для функционирования ЭБ;
• внесения определенных изменений в технологию работы подразделений библиотек, непосредственно связанных с комплектованием полнотекстовых информационных ресурсов — в частности, переход от привычных методов библиографической обработки к обработке, обеспечивающей полноценный обмен полнотекстовыми данными в интернете с применением систем метаданных и их форматов, использующих XML-ориенти¬рованные языки разметки гипертекста, а также современных сетевых протоколов.
Остановимся на важных, на наш взгляд, вопросах, связанных с организационно-техно¬логическим обеспечение подсистем ЭБ в АБИС [14].


В организационном плане возможны три подхода к созданию и обеспечению функционирования подсистемы ЭБ:
1. путем создания специального подразделения или группы подразделений, ответственных за работу ЭБ;
2. без выделения специальной структуры, обслуживающей ЭБ, — функции создания, поддержки и развития ЭБ распределены между другими подразделениями библиотеки и/или их отдельными сотрудниками;
3. комбинацией двух ранее названных подходов, при которой создаются только отдельные подразделения или рабочие группы, выполняющие определенную часть работ, связанных с поддержкой и/или развитием ЭБ.
Очевидно, что решение о выборе одного из указанных вариантов зависит от многих частных условий и принимается администрацией библиотеки, являющейся заказчиком и соразработчиком своей ЭБ. Тем не менее, независимо от варианта при¬нятого организационного решения, функции персонала, участвующего в подсистеме ЭБ, в основном должны соответствовать функциям, отвечающим организационно-технологической схеме, построенной по первому варианту (см. рис.1.).

Рис. 1. Укрупненная организационно-технологическая схема подсистемы «ЭБ»

Основные функции подразделений, обеспечивающих работу подсистемы «ЭБ».
1. Группа (подразделение) предварительного отбора литературы для ЭБ:
• в соответствии с решениями Редакционного совета производит предварительный отбор документов для ЭБ из текущего потока документов, поступающих в подсистему «Комплектования и обработки входных документальных потоков;
• производит анализ содержания и качества информационных ресурсов, установленных на сайтах других организаций в интернете и по согласованию с правообладателями этих ресурсов готовит предложения Редакционному совету по их использованию в своей ЭБ;
• готовит в соответствии с технологическими инструкциями материалы и массивы документов для Редакционного совета ЭБ.


2. Редакционный совет ЭБ:
• рассматривает и утверждает дизайн Web-страницы ЭБ, ее структуры и состава документов и данных контента ЭБ;
• руководит работой Web-мастера, поддерживающего сайт ЭБ;
• определяет порядок обновления контента ЭБ;
• производит окончательный отбор нового материала для ЭБ и передает его в подразделение технологической обработки документов;
• согласует и решает вопросы использования документов в локальном и внешнем доступе с их правообладателями;
• принимает решения о снятии с сайта ЭБ ранее поставленных на него документов и данных;
• принимает решения о порядке доступа внешних пользователей к разделам сайта ЭБ и/или отдельным ее ресурсам;
• устанавливает стоимость и порядок расчетов по предоставлению платных ресурсов ЭБ внешним и локальным пользователям;
• управляет работой Службы контроля использования ресурсов ЭБ и финансовых расчетов с пользователями.
Примечание: Желательно, чтобы руководство работой Редакционного совета ЭБ осуществлялось на уровне не ниже заместителя директора библиотеки.

3. Подразделение технологической обработки документов для ЭБ:
• производит сканирование документов, поступивших в библиотеку на твердых носителях;
• производит форматную и аналитическую обработку документов по инструкциям, подготовленным Группой АСЛО;
• в соответствии с установленным регламентом перегружает обработанные документы в технологическую БД ЭБ.


4. Группа АСЛО:

• разрабатывает технологические инструкции по использованию форматов и аналитической обработке документальных источников для ЭБ;
• поддерживает и развивает средства словарного и справочного обеспечения ЭБ;
• отслеживает сведения об изменениях нормативной базы в своей профессиональной области деятельности и использовании соответствующих средств в организациях реальных и потенциальных партнеров информационного взаимодействия в интернете, представляющих интерес для пользователей своей системы;
• готовит предложения и проекты технологических инструкций для утверждения Редакционным советом ЭБ;
• контролирует качество обработки документов Подразделением технологической обработки документов для ЭБ.


5. Группа системного администратора АБИС и Web-сервера:
• разрабатывает и создает сайт ЭБ в соответствии с решениями, принятыми Редакционным советом ЭБ;
• в соответствии с принятым регламентом производит актуализацию контента ЭБ путем загрузки новых документов в базы данных для внешних и внутренних пользователей, а также выгрузки в архив документов, определенных решением Редакционного совета;
• обеспечивает работу программно-технического комплекса Web-сайта ЭБ, включая меры ее информационной безопасности;
• реализует систему доступа пользователей (их аутентификацию и авторизацию) к платным ресурсам ЭБ по установленным Редакционным Советом ЭБ категориям;
• по решению администрации библиотеки и Совета ЭБ реализует развитие сервисов, предоставляемых внешним и внутренним пользователям ЭБ;
• поддерживает работу и развитие ЛВС.


6. Служба контроля использования ресурсов ЭБ и и взаимодействия с пользователями ЭБ»):
• осуществляет подготовку и реализацию договоров с пользователями платных ресурсов в соответствии с категориями, установленными Редакционным советом ЭБ;
• производит статистический контроль функционирования ЭБ по установленным Редакционным советом ЭБ критериям;
• осуществляет функции электронной доставки документов (ЭДД);
• осуществляет контроль авторизации и аутентификации пользователей, а также финансовых расчетов с пользователями платных ресурсов (предпочтительно с использованием биллинговой системы [4]);
• разрабатывает предложения по включению и исключению пользователей платных ресурсов ЭБ.


7. Служба архивации:

• обеспечивает хранение архивных копий документов ЭБ;
• ведет электронный каталог архива ЭБ;
• по указанию системного администратора производит дозагрузку или перезагрузку дискового архивного накопителя;
• разрабатывает предложения администрации библиотеки и по ее решению производит перевод архивных записей со старых на новые носители архивных копий документов и/или программные средства.
Очевидно, что состав организационно-технологической схемы в каждом конкретном случае, а также функции подразделений, входящих в ЭБ, могут отличаться. В указанном плане предложенная схема должна рассматриваться только как возможный вариант реальной подсистемы ЭБ в библиотеке.
По нашему мнению, в небиблиотечных информационных системах электронных библиотек приведенная организационно-технологическая схема может претерпеть некоторые изменения. Преимущественно они касаются функциональных узлов, связанных с подразделениями обработки текущих поступлений и ретроспективы литературы, а также справочно-информаци¬онных фондов. Что касается функций этих узлов, то они должны полностью возлагаться на блок технологической обработки документов для ЭБ. Возможно, что в некоторых реализациях технологической системы ЭБ разделения контента для внутренних и внешних пользователей не потребуется. Соответственно, базы данных для внутренних пользователей будут исключены.

Литература


1. Arms William Y. Digital Libraries / William Y. Arms. — Cambridge, Massachusetts, London, England.: The MIT Press, 2000. — 287p.
2. Антопольский А.Б. Лингвистическое обеспечение электронных библиотек / А.Б. Антопольский.— М.: НТЦ «Информрегистр», 2003.— 302 с.
3. Земсков А.И. Электронные библиотеки: учебное пособие для студентов ун-тов и вузов / А. И. Земсков, Я. Л. Шрайберг.— М.: МГУКИ: ГПНТБ России, 2001.— 91 с.
4. Воройский Ф.С. Информатика. Энциклопедический систематизированный словарь-справоч¬ник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах.— М.: Физматлит, 2006. — 767 с.
5. Черняк Л. О стеке стандартов Semantic Web // Computerworld. — 2006. –- № 12 (509) — С. 30, 31.
6. Whatis. com (Толковый энициклопедический словарь по информ. технологиям) [Электрон¬ный ресурс] — Режим доступа: http://whatis.techtarget.com/wsearchRe¬sults/1,29021¬4,sid9,00.html?query=script. — Загл. с экрана.
7. Белоокий А. Web 2.0: у истоков новой Вселенной. Идеология, методология и первый опыт // HARD и SOFT.— 2007.— № 5.— С. 112-116.
8. Асмаков С. Перспективные технологии: итоги и прогнозы / С. Асмаков, Н. Елманова, С. Пахомов, О. Татарников // КОМПЬЮТЕР ПРЕСС. — 2008. — № 1 — С. 4-43.
9. Лассила О. Освоение Web 3.0 / O. Лассила, Д. Хендлер // Открытые системы. — 2007. — № 05. — С. 64-67.
10. Шепелев В. Обалдеть, завтра дайте три! // Компьютерра. — 2008.— № 1-2 (717-718).— С. 24-27.
11.Гончаров М.В. Практическая реализация библиотечного Интернет-комплекса: научно-прак¬тическое пособие / М.В. Гончаров, К.А. Колосов.— М.: ФАИР-ПРЕСС, 2005. — 192 с.
12. Шрайберг Я.Л. Авторское право и библиотеки: рук-во для библиотечных и информационных работников / Я.Л. Шрайберг, А.И. Земсков, В.В. Терлецкий, В.Р. Фирсов. — М.: ГПНТБ России, 2007. — 48 с.
13. Правовые рекомендации для создателей и владельцев электронных библиотек / Сост. А.Б. Антопольский, Е.А. Данилина, И.В. Невзоров, Т.В. Майстрович, В.Н. Монахов, под ред. В.Н. Монахова.— М.: Российская ассоциация электронных библиотек, 2006.— 88 с.
14.Воройский Ф.С. Основы проектирования автоматизированных библиотечно-информа¬ционных систем. Изд. 2-е дополненное и переработанное. — М.: ФИЗМАТЛИТ, 2008. — 732 с.: ил. 25; табл. 19. Библиогр.: 430 назв. (в печати).