«Университетская книга» №2, 2015



В.Т. Грибов, И.П. Соловьёв

Новые технологии защиты электронных документов

Эффективное выполнение информационных запросов пользователей сегодня невозможно без предоставления им всего многообразия электронных информационных ресурсов, которыми располагает библиотека. Поэтому постоянная работа с электронными ресурсами и обеспечение доступа к ним превратились в обязательные функции современной библиотеки.

В связи с этим наблюдается постоянный рост количественных показателей электронного контента в библиотеках. Одновременно становятся всё более сложными процессы администрирования доступа к этим ресурсам и обеспечения их защиты от неправомерного использования. Последнее сформировалось в отдельную большую и сложную задачу, актуальность которой возрастает, в том числе в связи с тенденциями усиления контроля за соблюдением авторских прав на электронные ресурсы.

Основу программных средств для работы современной библиотеки составляют автоматизированные информационные библиотечные системы (АИБС/АБИС), и во многом именно они должны решать задачи эффективного поиска ресурсов и санкционированного доступа к ним.

Санкционированный доступ к электронному ресурсу предполагает прежде всего его просмотр, а также невозможность его копирования при отсутствии соответствующего разрешения. Для реализации этого в АИБС необходимо наличие механизмов так называемого защищённого про смотра электронных ресурсов.

Рассмотрим современные варианты реализации подобного функционала применительно к работе библиотек. При этом оговоримся, что данная статья относится преимущественно к полнотекстовым электронным документам (прежде всего представленным в формате pdf), однако это не сужает общности рассмотрения существующей проблематики для всех видов электронных информационных ресурсов.

Несмотря на обилие форматов полнотекстовых документов, в библиотечной среде наиболее распространённым является формат pdf. Несомненным его плюсом является богатый выбор вариантов отображения информации в виде как набора распознанных изображений, вставленных в документ, так и различных видов форм, графики, гиперссылок и даже видео (в спецификации pdf 1.7). При этом первоначально pdf представлял собой формат, предназначенный только для хранения текстовой и графической информации (спецификация pdf 1.3), в который в дальнейшем добавили спецификации для хранения медиаконтента.

Однако всё это богатство возможностей накладывает на разработчиков программного обеспечения ряд существенных трудностей и ограничений.

В отличие от форматов fb 2, doc, ePub или rtf структура pdf-файла представляет собой сложную иерархию, полную ссылок на разные ресурсы внутри документа, часть из которых не может быть определена сразу. Подобная структура серьёзно усложняет поиск текста в документе и влечёт увеличение затрат вычислительных ресурсов.

После такого «экскурса» в некоторые особенности формата pdf возвратимся к проблеме защиты электронных ресурсов.

Прежде всего следует понимать, что любая, даже самая надёжная, защита не даёт абсолютной гарантии и невозможности копирования в общем случае. Задача по защите ресурса скорее сводится к максимальному затруднению его копирования и позволяет установить место «утечки».

Наиболее распространённая схема взаимодействия «пользователь — контент» заключается в том, что пользователь осуществляет доступ к электронному ресурсу со своего устройства через Сеть, а сам ресурс находится на сервере библиотеки. Это предполагает использование веб-технологий, в которых основным программным обеспечением для просмотра электронных ресурсов являются различные браузеры. С одной стороны, это усложняет задачу организации защищённого доступа, с другой — становится понятным основной вектор потенциальных угроз для доступа к защищённой информации.

Одним из первоначальных вариантов защиты текстового контента является авторизация пользователя, т.е. предоставление доступа к документу только после подтверждения пользователем своих прав на его просмотр. Но, получив доступ к документу, пользователь имеет возможность его использовать, в том числе и неправомочно: «человеческий фактор» никто не отменял.

Другой вариант защиты — предоставление доступа не к исходному документу, а лишь к его запрашиваемой части. Полный документ пользователю не предоставляется, а «собрать» его из доступных фрагментов весьма затруднительно. В то же время и работать с такими фрагментами пользователю не очень удобно.

Гораздо более эффективным является вариант предоставления полного документа, но преобразованного в графический вид, когда символы текста заменяются изображениями. Это преобразование, с одной стороны, не снижает качества предоставляемой информации, но с другой — делает весьма проблематичным его обратное преобразование в текст.

К графическим документам может также применяться защита специальными метками — «водяными знаками», с помощью которых осуществляется однозначная идентификация правообладателя издания.

Для реализации защищённого просмотра в АИБС «МегаПро» мы объединили два последних подхода. Полученный результат представляет собой программное решение (модуль), реализующее опциональную функцию в модуле «Электронная библиотека» АИБС «МегаПро», которая получила название «Защищённый просмотр электронных документов в pdf-формате».

С точки зрения конкретной реализации защищённого доступа, перед нами стояла задача построения веб-приложения, которое имеет целый ряд программных особенностей.

Первой особенностью является то, что это приложение должно быть интегрировано в АИБС, установленную в библиотеке. Оно должно проверять учётные записи АИБС, получать из системы исходные документы и на их основании формировать данные для защищённого просмотра. С целью достижения максимального удобства интеграция подразумевает отсутствие специальной авторизации для пользователя при переходе к защищённому просмотру.

Вторая особенность — учёт многообразия устройств для работы в режиме защищённого просмотра и недопустимость его сужения. Ведь помимо настольных персональных компьютеров широко распространены планшеты, мобильные телефоны и прочие устройства, обеспечивающие возможность доступа к Интернету.

При этом не все технологии могут использоваться для защищённого просмотра. Например, широко распространена технология flash, позволяющая воспроизводить на html-страницах богатый набор графических возможностей: от простейшей анимации до сложных онлайн-игр. Однако в большинстве случаев она не поддерживается мобильными браузерами, что ограничивает её применимость. Конечно, возможно создание мобильных приложений в комплекте с основной версией программного обеспечения, но это отдельная большая и затратная задача.

Следующий вопрос — соблюдение минимальных требований к оборудованию. Любая работа с графикой, особенно если мы говорим о больших её объёмах, является затратным процессом с точки зрения ресурсов компьютера. Поэтому на устаревшем оборудовании система доступа к электронным ресурсам может работать излишне медленно, порождая не только неудобство, но и раздражение пользователей. В связи с этим программная реализация защищённого просмотра должна быть рассчитана на работу с допустимым быстродействием даже на устаревшем оборудовании. Этого можно добиться, как используя различные графические алгоритмы, снижающие интегральные затраты на обработку одного изображения, так и применяя параллельную обработку информации, сжатие пересылаемых данных, многоуровневое кэширование и т.д.

Чрезвычайно важным является и набор сервисов, которые предоставляет система защищённого доступа для конечного пользователя. Ведь он хотел бы не только «взглянуть» на документ, но и активно работать с ним. А для этого нужны функции полнотекстового поиска, постраничной навигации, масштабирования и т.д.

Мы решили названные выше задачи и реализовали в АИБС «МегаПро» функцию защищённого просмотра электронных документов в виде специального веб-приложения.

Зарегистрированный пользователь, задав поисковый запрос и получив ответ в виде списка библиографических описаний (рис. 1), может получить доступ к электронному документу для его просмотра.

Не указано


Пользователю предоставляются следующие сервисы:

• просмотр на экране электронного документа с наложением изображения водяного знака;
• возможность пролистывания электронного документа;
• возможность навигации (перехода на определённую страницу);
• возможность изменения масштаба изображения электронного документа на экране;
• полнотекстовый поиск.

Защищённый просмотр в АИБС «МегаПро» базируется на рендеринге электронных документов, представленных в pdf-формате. Рендеринг подразумевает разбиение файла электронного документа на графические элементы. Единицей графического элемента является одна страница.

При просмотре электронного документа на каждый графический элемент (страницу) для однозначной идентификации правообладателя (источника электронного документа) накладывается «водяной знак» в виде полупрозрачного текста, расположенного по диагонали страницы. При этом сам исходный электронный документ какому-либо изменению не подвергается.

Текст «водяного знака» определяется библиотекой по своему усмотрению с возможностью замены в любой момент и задаётся в соответствующих конфигурационных файлах.

Имеется возможность дополнительно усилить защиту, введя в водяной знак данные, идентифицирующие текущего пользователя, который просматривает документ (рис. 2).

Не указано


Электронный документ с наложенным водяным знаком размещается в специальном кэш-буфере на сервере. При последующих просмотрах электронного документа он загружается из кэш-буфера для увеличения скорости доступа.

Реализованная защита не позволяет пользователю одновременно запросить все страницы документа. При этом обеспечивается передача текстовой информации в графическом формате с широкими возможностями настройки водяных знаков. В случае несанкционированного копирования документов наложенный на него водяной знак существенно осложняет восстановление первоначального текста документа. При этом защита обеспечивает невозможность копирования файла электронного документа, в том числе в текстовом режиме.

Таким образом, система предоставляет библиотекам современное высокоэффективное решение для защиты электронных документов. Оно уже активно используется на практике. С решением можно ознакомиться в режиме демодоступа на сайте техподдержки megaprosoft.ru, а получить дополнительную информацию – на сайте dataexpress.ru.

Совершенствование функции защищённого просмотра продолжается, и мы будем рады представить новые решения в ближайшем будущем.

Авторы Владимир Тимофеевич ГРИБОВ, генеральный директор ООО «Дата Экспресс»; Иван Павлович СОЛОВЬЁВ, ведущий специалист- разработчик ООО «Дата Экспресс»