Память человечества. Об оцифровке как единственном способе сохранности коллекций и создании электронных библиотек
На протяжении веков в мире погибло несколько сотен библиотек. Причины были разные: религиозные войны и вооруженные конфликты, стихийные бедствия и неосмотрительность людей, неисправные проекторы и даже увеличительные стекла. Однако с конца 20 века мы имеем механизм, который может сохранить наше научное и культурное наследие. Почему же знания продолжают гореть?
Шотландский писатель Самюэль Смайлс считал, что книги бессмертны и являются самыми долговечными плодами человеческой деятельности. С этим высказыванием можно было бы согласиться, если бы Самюэль Смайлс жил в 21 веке, когда содержательная часть издания может не зависеть от его физического воплощения. Однако за годы существования книгопечатной продукции было множество катастроф, уничтоживших огромные запасы человеческих знаний именно из-за хрупкости их физической оболочки. К сожалению, даже сейчас, имея под рукой необходимые технологии охраны библиотечных фондов, мы не можем быть уверенными в стопроцентной сохранности коллекций.
Страницы минувшего
Обратимся к истории. На данный момент в многоязычной универсальной интернет-энциклопедии «Википедия» создана англоязычная статья под названием List of destroyed libraries, некий «свиток скорби», в котором представлено более 70 крупнейших библиотек мира, уничтоженных в ходе военных действий, пожаров, наводнений и т.д.
Наибольшую роль в уничтожении научного и культурного наследия сыграли люди. Сожжение библиотек и разорение архивов чаще всего было следствием так называемого «культурного геноцида» (понятие, выдвинутое адвокатом Рафаэлем Лемкиным в 1944 году; одно из проявлений геноцида, в частности уничтожение книг, произведений искусства, сооружений, - прим. авт.). Например, еще в 206 году до н. э. в результате вооруженного восстания был уничтожен исторический архив китайского города Сяньян. Книги из архива сжигались на дворцовой площади, а рядом с ними живьем закапывались ученые. Это привело к потере большого числа исторических рукописей, поэтических сборников и философских трактатов Китая.
В 47 г. до н. э. была уничтожена большая часть самой знаменитой библиотеки античного мира – Александрийской. По преданию, в ходе войны Юлий Цезарь оказался в осажденной Александрии. Чтобы выбраться из осады, он поджег свои корабли, и огонь с них перекинулся на библиотеку. Данные о количестве утерянных произведений сильно разнятся: одни историки заявляют о гибели 40 тысяч книг, другие – 400 тысяч. После этого библиотека была разрушена еще несколько раз: в 273 и в 391 году во время столкновения между язычниками и христианами.
Много потерь принесли и религиозные войны. Например, в 1193 году в результате мусульманских набегов был уничтожен университетский комплекс Наланда, который считается одним из родоначальников индийских университетов. В нем хранилось большое количество буддистских рукописей. Считается, что потеря библиотечных фондов стала одной из причин упадка буддизма в Индии. А в 1204 году в результате четвертого Крестового похода была разрушена Императорская библиотека Константинополя, последняя из великих библиотек древнего мира. В ней были собраны исторические, культурные и научные труды римлян и греков практически за 1000 лет. Какая-то часть коллекции была сожжена, оставшиеся книги разбрелись по библиотекам Османской империи или оказались в частных коллекциях.
Некоторым завоевателям было мало простого разорения архивов. В 1258 году монголами были разрушены все библиотеки Багдада. Большинство книг было сожжено, оставшиеся сбрасывались в Тигр. Их было так много, что в результате через реку был перекинут книжный мост, по которому ходили монгольские солдаты (подобным образом была уничтожена Библиотека Ктесифона, находящаяся в Древней Персии. Единственное отличие – книги сбрасывались не в Тигр, а в Евфрат).
Есть данные, которые говорят и об уничтожении первых прообразов библиотек в Северной и Центральной Америке. Например, в 1562 году епископ Диего де Ланда, уничтожил большую часть так называемых Кодексов майя, содержащих сведения о религии народа, его истории и передаваемых из поколения в поколение знаний. В его записях о делах в Юкатане (области, населенной народностью - прим. авт.) есть такие слова: «Эти люди употребляли также определённые знаки (caracteres) или буквы (letras), которыми они записывали в своих книгах свои древние дела и свои науки. По ним, по фигурам и некоторым знакам (senales) в фигурах они сообщали свои знания и обучали. Мы нашли у них большое количество книг, написанных этими буквами и, так как в них не было ничего, в чём не имелось бы суеверия и лжи демона, мы их все сожгли; это их удивительно огорчило и причинило им страдание».
Нулевой год
Не пожалел книги и 20 век. В первую очередь массовое уничтожение библиотек было вызвано Второй мировой войной: в 1914 году немецкими войсками была подожжена библиотека при Лувенском университете, основанном в 1426 (уничтожено порядка 300 тысяч книг); в 1941 во время фашистской оккупации была уничтожена Национальная библиотека Сербии; из-за бомбардировок в 1943 году погибла Национальная библиотека Болгарии; во время Варшавского восстания в 1944 году сгорела одна из первых национальных библиотек мира – польская Библиотека Залуских.
Вместе с научно-техническим прогрессом в 21 веке мир захватила лихорадка гражданских революций. В особенности они задели восточные земли и снова привели к уничтожению коллекций. Например, в 2003 году Национальная библиотека и архив Ирака (NLA), основанная в 1920 году и расположенная в Багдаде, в ходе военных действий была разграблена и подожжена некой группой людей. По оценкам экспертов, было уничтожено 60% архивных материалов, в том числе большинство исторических фотографий, книг и карт. Среди редких книг были и древнейшие копии Корана. Андраш Редмайер, библиограф Гарвардского университета, назвал этот инцидент «неисчислимой и в значительной степени невосполнимой потерей».
Примерно в это же время была разграблена и сожжена иранская библиотека Аль-Авкаф, в которой хранилось порядка 7,5 тысяч старинных рукописей, собранных с мечетей Багдада, и Баит-аль-хикма (библиотека при Иракской Академии наук), основанная в 80-х годах 20 столетия. Здание «дома мудрости» сгорело, а уцелевшие книги начали продавать в саду напротив. Подобным образом было разрушено около 20 библиотек и архивов, среди которых Центральная библиотека университета Багдада, Центральная библиотека университета Мосула и др. По мнению экспертов, «хватило всего пяти дней, чтобы уничтожить памятные вехи целой цивилизации: от ассирийских табличек до османских рукописей». По словам журналистов, для истории Ирака начался нулевой год.
О министре, цунами и герцогине
Может показаться, что уничтожение книг происходит исключительно в результате вооруженных конфликтов, и локализуется на Востоке. Однако это не так: в 2013 году правительство Канады во главе с премьер- министром Стивеном Харперо фактически уничтожило несколько библиотек при Департаменте рыболовства и океанов Канады (Department of Fisheries and Oceans). Первоначально представители власти собирались «сократить» количество библиотек с 9 до 7, сэкономив тем самым 443 тысячи долларов ежегодных расходов. Предполагалось, что все архивы будут оцифрованы и переданы в существующие библиотеки. Тем не менее, оцифровать удалось лишь 5-6% всего фонда, остальная часть была уничтожена – сожжена или выброшена. При том среди погибших произведений оказались данные, важные для экологических исследований, данные разведки времен 19 века и многочисленные рукописи.
Конечно, человеческие действия – не единственный фактор уничтожения библиотек. Не меньше зла бумажным изданиям причиняют и природные катаклизмы – например, в 2004 году на территории Индии, Индонезии, Малайзии, Таиланда, Мальдивских островов и Шри-Ланки было уничтожено несколько крупных библиотек и архивов из-за землетрясения в Индийском океане. А в 2004 году в результате пожара пострадала Библиотека герцогини Анны Амалии (Duchess Anna Amalia Library), основанная в 1766 году в немецком городе Веймар. Занятна история библиотеки: по сохранившимся данным, Анна Амалия наняла для своего сына – будущего герцога Карла Августа – репетитора, который переводил для него произведения зарубежных авторов. В основу коллекции легли его переводы Уильяма Шекспира. В дальнейшем видным покровителем библиотеки стал Иоганн Вольфганг фон Гете, который работал там с 1797 по 1832 год. Библиотека смогла уцелеть даже во время Второй мировой войны, поскольку большая часть коллекции была спрятана в бомбоубежищах. В результате пожара в библиотеке сгорело порядка 50 тысяч томов, 12,5 из которых считаются незаменимыми. К счастью, 6 тысяч исторических произведений были сохранены, среди которых были экземпляры Библии Лютера, документация Александра фон Гумбольдта (известного немецкого географа, натуралиста, исследователя - прим. авт.), и партитуры Иоганна Себастьяна Баха.
Российские потери
Упоминания о российских библиотечных пожарах зачастую связаны с пожарами городскими – например, в Первой Новгородской летописи, датируемой 1299 годом, говорится о Новгородском пожаре. Из-за него погибло порядка 12 церквей, из которых «не успели вынести ни икон, ни книг». Конечно, множество пожаров было связано с монголо-татарским игом и московскими пожарами, самый крупный из которых произошел 12 апреля 1547 года. Николай Карамзин, русский историк, писал о том, что «вся Москва представила зрелище огромного пылающего костра под тучами густого дыма. Деревянные здания исчезали, каменные распадались… Царские палаты, казна, сокровища, оружие, иконы, древние хартии, книги, даже мощи святых истлели».
Следующий крупный пожар приходится на 1812 год, во время вторжения французской армии. В результате пожара тогда сгорело 2/3 города. Пострадали здания Московского университета, была сожжена библиотека, хранившая 20465 томов, в числе которых были редкие книги, пожертвованные меценатами, дары профессоров университета. Перед приходом французов книги были спрятаны в подвальные помещения. Их это не спасло: из всего фонда сохранилось лишь 12 рукописей и 51 книга, перевезенные в составе университетского обоза в Новгород несколькими месяцами ранее. В огне погибли и многие личные библиотеки, порой превышавшие государственные по количеству произведений: например, одна из лучших книжных коллекций графа Бутурлина, насчитывающая 40 тысяч томов.
Самой страшной страницей в истории российских библиотек стала Великая отечественная война. По оценкам экспертов, за четыре года немецкими войсками были уничтожены как минимум 43 библиотеки. Согласно исследованиям, потери составили от 100 до 200 млн. томов. Среди них были и крайне ценные архивы – например, фонд дореволюционной литературы Центральной городской библиотеки города Калуги.
Одним из самых крупных пожаров 21 века на территории России стал пожар в Фундаментальной библиотеке Института научной информации по общественным наукам РАН (ИНИОН РАН), случившийся 30 января 2015 года. Как сообщали сотрудники МЧС, пожар начался на третьем этаже и уничтожил все левое крыло. Большая часть коллекции хранилась на цокольном этаже, благодаря чему осталась относительно целой, хотя и была повреждена водой. По оценке экспертов, в результате пожара пострадало порядка 5, 7 млн. единиц хранения, из которых 1,2 млн были подготовлены к списанию, 0,8 млн. имели дубликаты, а 1,1 млн. являлись экземплярами из числа обязательных, то есть хранились и в других библиотеках. Были полностью утрачены материалы генеральной ассамблеи ООН на русском языке, документы НАТО, материалы международного суда, часть библиотеки Института мировой литературы и Института славяноведения.
Издания, пострадавшие в результате воды, решили срочно заморозить, чтобы избежать воздействия грибка. Книги были вывезены в криокамеру Российского государственного архива научно- технической документации. По словам бывшего директора РГБ Александра Вислого, грибок, уничтожающий книги, не опасен для человека, однако опасен для других книг. Из-за этого вряд ли остальные библиотеки согласятся принять книги ИНИОНа – без активной проверки на грибковое поражение их придется хранить отдельно. А процесс заморозки, восстановления, проверки на грибковые поражения с учетом количества экземпляров может продлиться десятилетия. Все это время экземпляры фонда будут недоступны. Но десятилетия – это еще хорошо. По оценке руководителя Федерального агентства научных организаций, (ФАНО), Михаила Котюкова, на восстановление пострадавших изданий потребуется без малого полтора века.
Дело расследовалось: в пожаре обвиняли неких злоумышленников, проводку, директора библиотеки, аварийное состояние здания. Однако были и другие голоса – многие считали, что виновата система финансирования библиотек, при которой зачастую приходится выбирать между состоянием здания, противопожарной безопасностью и условиями хранения книг, и адекватной оплатой человеческого труда. Александр Вислый привел очень наглядный пример: «У нас в библиотеке 40 тысяч лампочек, обычных, по 30-40 рублей. Они пожароопасные. Светодиодная лампа стоит в районе 600 рублей. Умножаем. Чтобы просто поменять в библиотеке лампы нам нужно лишних 24 миллиона рублей».
В январе 2016 года СМИ сообщили, что на восстановление коллекции крупнейшего книгохранилища уйдет 3 года и 5 млрд рублей. В этом году под восстановление библиотеки было выделено 600 млн рублей, плюс – 98 млн. субсидированной поддержки на оцифровку «сухой» части коллекции. Кроме того, в сентябре завершился конкурс проектов будущего здания ИНИОНА; однако, как это повлияет на восстановление коллекции и сохранение фонда, неизвестно.
Оцифровать, нельзя оставить
На данный момент большинство крупных национальных библиотек, в которых хранятся особо ценные произведения (древние свитки, рукописи) как правило снабжены системой безопасности: в помещениях установлены противопожарные двери, морозильные камеры, детекторы дыма, системы подавления огня, аварийные генераторы и разбрызгиватели с водой. Кроме этого в некоторых странах за противопожарной безопасностью в библиотеках следят специальные организации или даже сотрудники полиции – примером может служить Библиотека Конгресса США, являющаяся одной из крупнейших в мире (в ее фонде содержится более 155 млн. единиц хранения), что, тем не менее, далеко не всегда гарантирует сохранность коллекций. Несмотря на все предосторожности, риск возникновения возгорания или повреждения коллекций есть, и обусловлен либо природными аномалиями (наводнения, торнадо, возгорание в результате удара молнией и т.п.), и, разумеется, в большей мере – невнимательностью людей, несоблюдением техники безопасности сотрудников и посетителей.
Чтобы понять всю хрупкость этих бумажных дворцов и несостоятельность даже усовершенствованных систем безопасности, можно привести несколько примеров: Юридическая библиотека при университете Далхаузи в Канаде была уничтожена вследствие короткого замыкания, публичная библиотека в Нортене (городок в графстве Дэвон, Англия) сгорела из-за того, что свет от увеличительного стекла упал на груду листовок, находящихся поблизости от коробок с книгами. Первый случай произошел в 1985 году, а второй – в 2005, при этом по оценкам экспертов было уничтожено 90% фонда, в том числе и особо ценные экземпляры коллекции.
Получается, что какой бы совершенной не была система безопасности, риск потери коллекций остается всегда. Если традиционные способы защиты не помогают, это значит, что нужно обратиться к новым технологиям, которые смогут обеспечить сохранность человеческих знаний. И одним из инструментов, которые могут позволить это сделать, является оцифровка.
Оцифровка (от англ. digitization) в самом общем виде представляет собой перевод объекта (аудио- и видеозаписи, изображения, текста) в цифровой вид, пригодный для записи на электронные носители. Если мы говорим о бумажных носителях, то процесс оцифровки включает два этапа: первоначальное сканирование изображения текста и его последующее распознавание (т.е. перевод изображения текста в текстовые данные). Для существования процесса оцифровки первый этап является обязательным: это непосредственное получение копий страниц, осуществляемое или с помощью сканера, или с помощью фотоаппаратуры. В результате можно получить точную копию книги с ее первоначальной версткой. Извлечение фрагментов текста (копирование или цитирование) будет невозможно. Второй этап нужен для создания полноценных электронных библиотек, в которых пользователи смогли бы читать книги также, как и их «живые» аналоги.
Конечно, оцифровка бумажных носителей – процесс дорогостоящий. Стоимость аппаратуры варьируется от 200 тысяч рублей до 300 тысяч долларов. При этом самые усовершенствованные, роботизированные сканеры в час способны оцифровать не более 3 тысяч страниц. Если мы говорим о доступе к электронным копиям, то нам потребуется еще и специальные программы для того, чтобы распознать текст. При этом абсолютная текстовая точность оцифрованного издания достигается исключительно при редактировании такого текста человеком. Количество погрешностей увеличивается при наличии слов, не распознающихся программным обеспечением (например, устаревшие слова или терминология). Остается и вопрос и с языковым разнообразием таких программ: в крупных библиотечных фондах встречаются экземпляры книг, написанных на редких языках, и для того, чтобы распознать написанное, нужен не только специальный человек, занимающийся редактированием итогового материала, но в первую очередь носитель языка, переводчик или эксперт. Для многих библиотек такие суммы неподъемны.
С созданием онлайн-библиотек, к которым имели бы доступ пользователи, дело обстоит еще сложнее. Тут речь идет уже о правовых вопросах. Например, библиотеки могут свободно оцифровывать произведения, которые согласно 4 статье ГК РФ перешли в общественное достояние. Однако мировые фонды включают в себя и те издания, авторские права на которые еще принадлежат правообладателю или же, что подчас даже хуже, входят в список так называемых произведений с недоступным правообладателем (orphan work, сиротские произведения). В соответствии с законодательными актами, при желании оцифровать ту или иную книгу библиотеки и архивы обязаны получить письменное разрешение у автора или правообладателя (если был факт передачи авторских прав), которое, как правило, сопровождается массивом юридических документов и денежной компенсацией. Кроме того, правообладатель запросто может отказать в оцифровке, опасаясь нелегального распространения оцифрованных копий, что, конечно, напрямую повлияет на будущую прибыль. Эти опасения уже не раз становились на пути возможности легализации оцифровки изданий библиотеками и архивами без запроса разрешения у правообладателя.
Тоска по НЭБу
История многократно подчеркивала то, что людям нужно искать другие, более действенные способы для сохранения культурного и научного наследия. Одной из инициатив в этой сфере стало создание Национальной электронной библиотеки (НЭБ), основанной в 2004 году. Работу над проектом частично вела Российская государственная библиотека. С 2013 года Министерство культуры РФ начало финансировать проект, и за последние 3 года потратила более 700 млн рублей, вложенных в разработку портала, создание реестра свободных от авторских прав книг в других национальных библиотеках, оцифровку произведений, поддержку ПО, разработку мобильных приложений с системой защиты авторских прав и т. п. И, казалось бы, при таком финансировании, людях, задействованных в проекте, все должно получиться… Но не совсем.
Вместо полноценного «электронного пространства знаний» получился достаточно неудобный портал, который, кажется, делает все, чтобы пользователь не получил заветную книгу. Во-первых, в библиотеке огромное количество дублирующих друг друга копий одного и того же произведения. Во-вторых, читать защищенные авторским правом произведения по-прежнему можно только в той библиотеке, которой эта книга принадлежит. В-третьих, для чтения необходима установка программы, которая не даст пользователю скопировать отрывок произведения или сделать скриншот с экрана. К тому же, НЭБ не индексируется поисковыми системами, так что найти необходимое произведение достаточно сложно. А скачать свободные от копирайта экземпляры произведений, перешедших в общественное достояние, можно только в виде pdf, что далеко не всегда удобно. НЭБ оказался очень хорошим проектом с плохой реализацией; и несмотря на то, что в библиотеке действительно можно найти уникальные издания, вряд ли многие станут это делать.
Что делать?
Риски аналогового хранения очевидны. А пути для сохранения коллекций немногочисленны и по сути содержат следующие положения, касающиеся как правовой, так и технической стороны вопроса.
Во-первых, необходимо реорганизовать правовую систему, дать возможность крупнейшим российским библиотекам свободно оцифровывать экземпляры произведений и постепенно организовывать электронные хранилища с доступом пользователей хотя бы к тем изданиям, которые уже находятся в общественном достоянии. Кроме этого, необходимо создать так называемые «центры оцифровки», которые позволят сделать электронные копии редких произведений, хранящихся в региональных архивах. Также необходимо обеспечить максимально высокую скорость оцифровки произведений, организовав государственную систему финансирования.
Во-вторых, для «правового равновесия» авторов и библиотек необходимо создать стандартную систему электронной защиты произведений от копирования, скачивания и дальнейшего несанкционированного распространения копий, но при этом, что немаловажно, сделать эту систему доступной и удобной для самих пользователей, включив в нее возможность цитирования. Наконец, нужно создание единой поисковой системы по всем оцифрованным произведениям. И, конечно, необходимо обеспечить защиту «живых» экземпляров, их сохранность не только до момента оцифровки, но и в будущем – как-никак, ценность таких произведений состоит не только в их содержании, но и в самом факте существования, их древности.
Оцифровка – это долгий и очень затратный процесс, который может растянуться на многие десятилетия. Но он необходим, так как создание нового возможно лишь тогда, когда больше не нужно постоянно беспокоиться о сохранности старого.