«Информационные Ресурсы России» №3, 2006



Открытые архивы в системе научной и технической информации

В последние годы сфера научной и технической информации (НТИ) во многих странах мира претерпевает существенные изменения. Если в России, странах СНГ и  бывших социалистических странах такие изменения, прежде всего, связаны с продолжающейся трансформацией экономического и общественного уклада, то в странах Запада поиски новых путей информационного обеспечения научного и технологического прогресса определяются новым фазисом социального и экономического развития, характеризуемым понятиями «общества знаний» и «экономики знаний». Определяя новую политику в области НТИ, Россия и страны «ближнего зарубежья», испытывающие многие общие трудности переходного периода, должны, с одной стороны, обеспечивать возможности выхода отрасли из глубокого кризиса, а с другой стороны, ориентироваться на те новые подходы, которые интенсивно разрабатываются в западных странах и трансформируют сферу НТИ в активный фактор развития общества и экономики знаний.
Следует отметить, что современные тенденции развития информационной сферы базируются на признании исключительно важной роли науки и НТИ и характеризуются поисками путей вывода научно-информационной деятельности из рыночной парадигмы. Для России, где некоммерческие  общественные и частные фонды и институты в сфере науки и НТИ находятся в зачаточном состоянии, это означает ведущую роль государства в финансировании и регулировании информационной деятельности, по крайне мере, в ближайшие десятилетия, тем более что даже в странах с наиболее развитой либерально-рыночной экономикой государство никогда не устранялось от финансирования сфер науки, образования, культуры и НТИ. Свёртывание роли государства, в том числе и как основного источника финансирования, в этих сферах означает в российских условиях их гибель.
Несостоятельными представляются и попытки ревизии, «осовременивания»  самого понятия и термина «НТИ», которые, кстати, предпринимаются только в России и проявляются, в частности, в каком-то смешении понятий информационной и инновационной  деятельности. Никто не ставит под сомнение исключительно важную роль последней как обеспечивающей наиболее быстрое и эффективное внедрение в экономику новейших достижений науки и техники. Создание действующей инновационной системы – отдельная задача, которая не может быть решена в рамках системы НТИ, а зависит от подъёма промышленности в целом и требует, прежде всего, соответствующего политического, правового и налогового регулирования.  Информационная сфера призвана обслуживать инноватику, но в контексте экономики знаний НТИ обладает гораздо более значительным потенциалом, чем чисто в утилитарном аспекте. Научное знание есть упорядоченная и усвоенная  информация, но информация именно научная не только по содержанию, но и по уровню, то есть достоверная, проверяемая, подтверждаемая экспериментами и научными авторитетами, в противоположность псевдонаучной, оккультной и прочей лженаучной информации, столь обильно публикуемой сейчас в СМИ и сомнительных «научных» изданиях.
В самом деле, экономика знаний реализуется в той общественной среде, которая характеризуется как общество знаний – новый фазис развития информационного общества. Общество стало информационным с тех пор, как физический, «реальный» мир уже не может существовать без параллельно существующего и развивающегося виртуального мира, основу которого составляет сетевой компьютинг. Виртуальная сетевая среда служит технологической базой широкого распространения знаний. То, что «знание – сила», было известно и раньше. Один из основоположников науки в её современном понимании Френсис Бэкон, видимо, процитировал это латинское изречение в своём «Новом органоне»: “Scientia est potentia”. (К.А.Тимирязев перевёл его как «В науке – мощь») [1].  Однако во всех элитарных общественных формациях знание было достоянием лишь элиты, и в этом смысле его «мощь» была ограничена. Только утверждение демократических принципов позволяет сделать знания доступными для всего общества, то есть говорить об обществе знаний, в котором эффект знаний неизмеримо усиливается, и виртуальная сетевая среда служит технологической базой самого широкого распространения знаний. (Здесь очевидно, что усиленное насаждение платного образования в современных российских условиях уводит страну в направлении, противоположном от общества знаний).
Экономика знаний предполагает развитое состояние четырёх сфер: генерации знаний – сфера науки; освоения знаний – сфера образования; внедрения знаний – сфера производства и услуг; накопления и распространения знаний – сфера научной и технической информации. Сфера НТИ осуществляет информационную поддержку и обеспечение трёх остальных сфер, которые просто не могут эффективно функционировать без развитых институтов НТИ. Однако эти институты играют ведомую роль относительно ведущих сфер науки, образования и производства, и массовая востребованность НТИ, а, следовательно, и относительно благополучное существование депозитариев и центров НТИ, возможны лишь при развитом состоянии науки и производства. Сейчас же в России основным потребителем НТИ является лишь сфера образования, так как наука и производство находятся в упадке. Именно поэтому на период выхода науки и производства из кризиса и формирования негосударственных институтов финансирования бремя финансовой поддержки системы НТИ должно нести государство, и, возможно, не стоит торопиться с изгнанием слова «государственная» из названия воссоздаваемой в России системы НТИ и заменой его на «национальная» - кальку с американского английского языка. Ведь в США в силу совершенно других, чем в  России, экономических и политических  условий система НТИ действительно «национальная», тогда как в России в течение еще, по крайней мере, лет десяти, система НТИ может возродиться и быть эффективной только как «государственная». Существует и лингвистическая причина в предпочтении этих терминов: в США многие институты федерального уровня называются «национальными» ещё и потому, что английское слово «state» означает как «государство», так и «штат», и при действующей административной структуре США словосочетание «state system» двусмысленно, а в русском языке прилагательное «национальный» употребляется традиционно и по преимуществу в этническом смысле.
Итак, в условиях России и стран СНГ, как и во всём мире, информационная деятельность является неотъемлемой составляющей развития экономики знаний, причём основной предмет этой деятельности составляет научная и техническая информация, отражающая  достижения и результаты  фундаментальных и прикладных наук и обеспечивающая прогресс во всех сферах жизненного цикла знаний – их генерации, освоения и внедрения. В отсутствии других возможностей организации и финансирования, по крайней мере, в ближайшем будущем, восстановление и развитие информационной деятельности должно осуществляться в рамках государственной системы НТИ. Даже при вовлечении в научно-информационную деятельность и других, негосударственных институтов, системообразующую роль в сфере НТИ (как, впрочем, и в сферах науки и образования) может и должно играть только государство.
 Государственная система НТИ призвана, прежде всего, способствовать решению двух  основных задач: формирования информационного ресурса, то есть совокупного федерального фонда источников НТИ, и обеспечения широкого и оперативного доступа к НТИ. Без решения этих фундаментальных задач, а они в постсоветской России не решены, невозможно построить ни экономику знаний, ни «национальную инновационную систему», ни интегрированную научно-образовательную и производственную среду.
Отличительной особенностью решения классических задач организации информационных ресурсов и доступа к ним в современных условиях является наступление эры электронных (в англоязычной технической литературе принят более конкретный термин «цифровых») документов. Новые условия электронного создания, обработки и распространения документов-источников НТИ поставили перед научным и информационным сообществом целый ряд проблем, которые требуют не столько технического, сколько экономического, правового, этического решения. В самом деле, стираются границы между традиционными и электронными изданиями, между публикуемыми  и непубликуемыми документами, то есть между «белой» и серой литературой, при этом последняя становится информационной базой виртуального сетевого мира, играя ту же роль, которую печатные издания играли 500 лет со времён Гуттенберга. Большинство документов в исходном виде готовятся в электронной форме – “digitally-born”, разница между копией и оригиналом становится относительной, авторское и смежное право оказывается не в состоянии сдержать напор контрафактной продукции и плагиата, коммерческие механизмы не могут обеспечить баланса интересов авторов, потребителей и издателей сферы НТИ.
Таким образом, необходимость эффективного функционирования триады «наука – образование – производство» в условиях экономики знаний, с одной стороны, и наступление эры электронных документов и виртуальной сетевой среды, с другой стороны, потребовали смены концептуальной парадигмы развития системы НТИ. Прежде всего, традиционные рыночные механизмы, эффективные в одной из сфер экономики знаний  - сфере производства, услуг и торговли, оказались неработоспособными в сфере НТИ. Как показывает опыт ведущих в науке и технике стран, коммерческий принцип функционирования научно-издательских и информационных организаций стал препятствовать широкому распространению научных знаний, то есть стал тормозом экономики знаний. Неолиберальная политика в информационной научно-образовательной сфере привела к очевидному парадоксу, когда эффективность деятельности частных информационных и издательских структур на прибыльной основе оказывается тем выше, чем в большей степени она препятствует выполнению главной общественной задачи обеспечения свободного и оперативного доступа к новейшим достижениям науки и техники, без чего не могут существовать ни общество, ни экономика знаний.
Партнёром и помощником государства в деле поддержки и развития системы НТИ должны стать не коммерческие структуры, не частный бизнес, прибыльная основа деятельности которых по самой своей природе оказывается контрпродуктивной в данной сфере, а совсем иные экономические механизмы и общественные институты, на создание которых и направлены сейчас основные усилия не только профессионального мирового информационного сообщества, но и властных структур ведущих стран мира.
Высокая степень монополизации мирового рынка научной и технической информации привела к тому, что свои условия и цены на нём диктуют лишь несколько крупнейших транснациональных корпораций. Так, в 2003 году около 30% мирового рынка НТИ (включая публикации по медицине, но исключая публикации по гуманитарным наукам) принадлежало издательскому гиганту Рид-Эльсвиер (Reed-Elsevier), публикующему около 1800 наименований НТИ-изданий, 14% - Шпрингер-Клювер (Springer-Kluwer), 9% - Томсон (Thomson) [2].  Эти монополисты получают сверхприбыли за счёт непомерного завышения цен на ведущие издания научной периодики, подписка на которые стала недоступной не только для большинства представителей академического сообщества, но и для такого крупнейшего мирового депозитария источников НТИ, как Библиотека Конгресса США. (Нечего и говорить о том, в какой информационной блокаде в сложившейся ситуации оказалась Россия).
В массовом порядке вынуждены отказываться от подписки на научную периодику издательства Эльсвиер такие ведущие высшие школы США, как Гарвардский университет, Массачусетский  технологический институт, Университет штата Северная Каролина и многие другие. В 2003 году Корнельский университет (штат Нью-Йорк) заплатил 1,7 млн. долл.  за подписку на 930 наименований издательства Эльсвиер, что составило 20% от  расходов университета на подписку на периодику  и только 2% от общего числа наименований периодических изданий, на которые подписывается университет [3].  Результат тот же – отказ от услуг издательства.
 В июле 2004 года Комитет по науке и технике Палаты общин британского парламента опубликовал доклад по научным публикациям, в котором выражается «растущая тревога по поводу того, что чрезмерная доля финансовых выгод от существенных правительственных инвестиций в научные исследования направляется в карманы частных издателей» (перевод здесь и далее мой. – Л.П.) [4].  А председатель Комитета Иан Гибсон даже обвинил коммерческие издательства в «ограблении академического сообщества» [5].  (Отметим, что в английском языке прилагательное “academic” означает принадлежность к науке и высшей школе, а не как в русском – к Академии наук).
Незадолго до публикации британского доклада Комитет по бюджету  Палаты представителей Конгресса США выразил озабоченность растущими ценами на научные журналы и возникающими трудностями доступа общественности к результатам научных исследований. Комитет одобрил законопроект, поддерживающий открытый доступ к материалам, публикуемым Национальным институтом здравоохранения США [6]. Ведущие научные ассоциации Германии, Франции и Швейцарии подписали так называемую «Берлинскую декларацию», призывающую к обеспечению свободного доступа к результатам научных исследований [7]. 
Европейская Комиссия инициировала расследование деятельности по публикации научных журналов в Европе, цель которого в поиске путей совершенствования доступа к достижениям науки [8]. В результате встречи на уровне министров Комитет по научно-технической политике Организации экономического сотрудничества и развития (OECD) принял решение «способствовать бюджетному финансированию режимов доступа к электронным данным научных исследований» [9].
Таким образом, на рубеже 90-х – 2000-х годов несостоятельность действовавшей рыночной концепции в сфере НТИ  ведущих стран мира стала очевидной для большинства сообществ, участвующих в производстве и потреблении знаний, и только издатели-монополисты продолжают лоббировать в коридорах власти существующий порядок.  Назрела необходимость кардинально других подходов, которые смогли бы удовлетворить потребности распространения и получения новых знаний и в то же самое время обеспечить баланс интересов в правах на интеллектуальную собственность. Таким новым подходом стала концепция, получившая широкую известность под названием «инициатива открытых архивов» (ИОА; англ. “Open Archives Initiative” – OAI). Заметим сразу, что слово «архивы» в этом названии употребляется в более специфическом, чем традиционное, принятое в архивном деле, значении: под «архивом» здесь понимается сервер, хранящий источники НТИ в открытом сетевом доступе. В ИОА можно выделить две стороны: концептуальную и технологическую.
Концептуально, суть инициативы открытых архивов состоит в том, чтобы противопоставить неолиберальной парадигме «знание – товар», заводящей сферу НТИ в тупик, некоммерческий принцип открытого доступа к результатам научной и технической деятельности для самого широкого круга пользователей в сетевом режиме с помощью специальных программно-технологических средств.  «Открытость» архивов здесь понимается, прежде всего, с позиций системной архитектуры, использующей машинные интерфейсы, которые обеспечивают доступность контента различных провайдеров, и не означает полную свободу и неограниченность доступа к информации, так как денежная стоимость не является единственным ограничителем доступа, и его санкционирование в соответствии с теми или иными критериями всё равно должно соблюдаться.
Инициатива открытых архивов имеет определённые прецеденты. Можно сказать, что ИОА перенесла в сферу НТИ принципы, заложенные в 80-е годы в области разработки программных средств и получившие название «открытых исходных кодов» (англ. “Open Source”). Предоставление авторами в открытый доступ разработанных программных средств не давало коммерческих выгод, получаемых от программирования под известными на рынке фирменными именами, но работало  на престиж программиста, существенно повышая его «нематериальные активы». В этом движении очень знаменательно стремление поставить этические принципы, пренебрегаемые в рыночных моделях, выше меркантильных.
Технологически ИОА уходит корнями в практику электронных публикаций результатов научных исследований,     самоархивируемых авторами на сетевых серверах для открытого доступа (англ.“E-Prints”). Такие модели научных коммуникаций в форме онлайновых хранилищ электронных публикаций стали развиваться в 90-е годы  и продемонстрировали жизнеспособную альтернативу традиционных журнальных публикаций. К концу 90-х годов необходимость радикальных изменений в сфере научных коммуникаций признаётся всеми, остаются лишь разночтения по вопросу природы изменений, которые должны произойти. Среди катализаторов происходящих изменений отмечаются следующие факторы.  Во-первых,  возрастающие темпы получения важных научных результатов во многих науках, прежде всего, в физике, биологии, информатике, требуют более оперативного их доведения до сведения научных сообществ, чем это возможно посредством традиционных журнальных публикаций. Во-вторых, повсеместное распространение быстродействующих вычислительных сетей и персональных компьютеров создаёт повышенный спрос на их использование для распространения научных результатов. В-третьих, коммерческая экономическая модель научных публикаций в значительной мере подорвана стремительным ростом цен на подписку при относительно неизменных бюджетах научных библиотек [10].
 Наиболее известным примером успешного использования сети Интернет для оперативного распространения научных достижений является электронный «Архив по физическим наукам», функционирующий в Лос-Аламосской национальной лаборатории (США) [11]. Этот открытый архив уже радикально изменил парадигму публикаций в соответствующей научной области. Профессор Стивен Харнэд, один из авторов и безоговорочных сторонников концепции ИОА, рассматривает такие архивы как первые шаги на пути коренных изменений в сфере НТИ, в результате которых контроль над интеллектуальной собственностью и процессами публикации будет осуществляться самими авторами [12].
Как отдельное движение ИОА оформилась в октябре 1999 г., когда в г. Санта-Фэ (Нью-Мексико, США) состоялась рабочая встреча по вопросам развития механизмов электронных научных публикаций. Эту встречу можно считать началом систематической работы по объединению сетевых контент-провайдеров под эгидой ИОА. С тех пор ИОА прошла период бурного организационного и технологического развития. Контекст приложения концепции, первоначально ограниченный электронными публикациями, был существенно расширен, чтобы включить контент-провайдеров из самых различных областей науки и техники и всю издательскую деятельность в сфере науки и высшей школы (эта сфера в английском языке называется одним словом “scholarly”, во многом синонимично с “academic”). Была разработана и подвергнута всестороннему тестированию обширная программно-технологическая база, создана эффективная организационная структура ИОА. К сожалению, российские учёные и специалисты в области НТИ, по известным внутренним причинам, оказались практически изолированными от этих важных мировых начинаний, имеющих принципиальное значение для реанимации государственной системы НТИ и становления общества и экономики знаний.
С целью обеспечения организационной стабильности в 2000 г. был создан Координационный комитет ИОА, в который вошли представители научных, университетских, библиотечных и информационных сообществ США, Великобритании и Германии. Координационный комитет сформулировал и опубликовал в специальном пресс-релизе основные цели и задачи ИОА, среди которых «разработка и внедрение стандартов совместимости и взаимодействия (интероперабельности) открытых архивов для эффективного распространения контента», при этом технологическая база и стандарты ИОА «независимы как от типа предоставляемого контента, так и от экономических механизмов, связанных с этим контентом, и должны обеспечивать самый широкий доступ к различным цифровым материалам» [13].
Внедрение ИОА даёт очевидные преимущества для общества и способствует формированию подлинного общества знаний, предоставляя потребителям знаний возможности оперативного и бесплатного доступа к новейшим результатам исследований ведущих научных школ. Участвуя в ИОА и размещая свои работы в открытых архивах, авторы приобретают свободу от коммерческих издательств, получают возможность наиболее быстрого оповещения научной общественности о достигнутых результатах (а, следовательно, и оперативного закрепления своих приоритетов), создают и  публично поддерживают свой научный авторитет, своё «доброе имя» в науке, которое в здоровом научном сообществе стоит гораздо дороже гонорара за статью. Наряду с утверждением этических принципов в науке, в рамках ИОА прорабатываются и новые экономические модели открытых электронных публикаций. Так, в исследовательских грантах предлагается предусматривать отдельную статью на поддержку самоархивирования. Проф. С.Харнэд видит два основных пути экономического обеспечения ИОА: так называемый «золотой путь» публикации в открытых архивах, когда стоимость публикации оплачивается не институтом пользователей-подписчиков, а институтом авторов, и «зелёный путь» публикации результатов в традиционных журналах и самоархивирования этих же результатов в открытых архивах [14].
 В основу технических решений, реализующих ИОА, положен принцип низких барьеров в обеспечении интероперабельности [15]. Конечно, в таком подходе присутствуют функциональные ограничения, и другие стандартные решения, например, Z39.50, охватывают более полный функциональный набор. Однако известно, что с ростом функциональности возрастает и стоимость реализации стратегий интероперабельности (в основном, из-за трудностей реализации). Разработчики технологической базы ИОА не ставили целью заменить все существующие подходы, но стремились, прежде всего, к простоте внедрения и использования предлагаемых решений. Интероперабельность характеризуется несколькими аспектами, включая однозначные имена, форматы метаданных, модели документов и протоколы доступа.
Различают два класса участников в ИОА: провайдеры данных, или контент-провайдеры, которые используют средства ИОА для представления метаданных контента; провайдеры услуг, или сервис-провайдеры, осуществляющие сбор метаданных с помощью ИОА-протокола и использующие эти метаданные для предоставления дополнительных услуг.
Проблема интероперабельности на уровне метаданных решается в ИОА требованием от всех контент-провайдеров представлять метаданные в общем формате Дублинского ядра. Кроме того, для учёта специфики описаний, принятых в различных сообществах, допускаются иные параллельные наборы элементов метаданных. Технические требования ИОА не накладывают на природу таких параллельных наборов никаких ограничений, кроме того, что записи метаданных должны быть структурированы как XML-документы. Под записью в ИОА понимается последовательность байт, представленных на языке XML; запись состоит из трёх частей: заголовка, собственно метаданных (обязательно в формате Дублинского ядра, другие форматы опциональны) и примечаний (как правило, этот раздел содержит дополнительную информацию о метаданных, например, сведения о правообладателях, условиях использования метаданных и т.п.).
Программно-технологическая реализация ИОА основана на применении специального ИОА-протокола сбора метаданных (англ. аббревиатура OAI-MHP от “Open Archives Initiative Metadata Harvesting Protocol”). Задача выполнения требований ИОА облегчается для контент-провайдеров благодаря использованию в протоколе OAI-MHP запросов типа GET и POST протокола HTTP. Очевидно, что для многих пользователей желательно получить доступ к полнотекстовому документу, описанному в найденной записи метаданных. Протокол OAI-MHP рекомендует использовать для такой связи специальный элемент записи, которым может быть идентификатор, предусмотренный в формате Дублинского ядра.
Концепция и технология ИОА приобретает всё большее число сторонников в научных и информационных сообществах ведущих стран мира, прежде всего потому, что позволяет поставить практические барьеры на пути крайне негативных последствий коммерциализации науки и сферы НТИ, о которых так прозорливо предупреждал известный русский теоретик неолиберализма и постмодернизма профессор А.С. Панарин: «Если наука целиком превращается в производство знания-товара, то… рыночный статус знания неминуемо влечёт за собой вымывание тех его разновидностей, которые не приняли товарную форму и не могут служить немедленной прикладной (технологической) пользе. Это касается фундаментальной науки, гуманитарного корпуса, примыкающего к общей культуре, и всего теоретического образования. …Если наука – товар, то её перекупят самые богатые, которые постараются сделать из неё свою монополию. Внутри страны это означает постепенный переход науки, по крайней мере, прикладной, на сторону олигархов, финансовых спекулянтов и дельцов теневой экономики» [16]. Западное общество не только осознало и испытало на практике опасность этих негативных тенденций, но и активно включилось в противодействие им. В сфере научной и технической информации такое противодействие выражается, прежде всего, в широком внедрении инициативы открытых архивов.

Литература

 1. Тимирязев К.А. Наука. Соч., т. 8, М., 1940. - С.23.
  2. Blaaij de, Cees. Two Worlds: About Bars and Stars in Scientific Information Publishing, An Analysis of Open Source Ideology As a Means of Self-controlled Publishing. GL6 Conference Proceedings: Sixth Internat. Conf. On Grey Literature: Work on Grey in Progress, 6-7 December 2004. - Amsterdam: TextRelease, January 2005. - P. 107.
 3. Ibid. P.108.
 4. UK House of Commons Science and Technology Committee, Tenth Report, Scientific Publications: Free for All?. - dd. July 7th 2004; HC 399-I, HC 399-II. http://www.parliament.the-stationery-office.co.uk/pa/cm/cmstech.htm.
 5. The Times (London), August 6, 2004.
 6. NIH Open Access Plan – Frequently Asked Questions  available at http://www.earlham.edu~peters/fos/nihfaq.htm.
 7. http://www.zim.mpg.de/openaccess-berlin/berlindeclaration.html.
 8. The Guardian, City Pages, June 18, 2004.  - P. 30.

 9. Science, Technology and Innovation for the 21st Century. Meeting of the OECD Committee for Scientific and Technological Policy at Ministerial Level. 29-30 January 2004. - Final Communique.
10. Lagoze C. and Van de Sompel H. The Open Archives Initiative: Building a low-barrier interoperability framework. Proceedings of the ACM/IEEE Joint Conference on Digital Libraries, Roanoke VA (USA), June 24-28, 2001.  - P. 54-62.
11. Ginsparg P. Winners and Losers in the Global Research Village// The Serials Librarian. - 1997.  - N 30(3/4).  - P. 83-95.
12. Harnad S. Free at Last: The Future of Peer-Reviewed Journals//D-Lib Magazine. -  1999.  - N 5(12).
http://www.dlib.org/dlib/december99/12harnad.html.
13. http://www.openarchives.org/OAISC/oaiscpress000825.htm.
14. MacLeod D. Academics fight to break “stranglehold” on journals. Guardian Unlimited, January 26, 2005.
15. http://www.openarchives.org.
16. Панарин А.С. Искушение глобализмом. - М., Алгоритм. - 2001. - 558 с.