14 декабря 2011

Под управлением Vivaldi

  Не указано

 

 — Олег, скажите, пожалуйста, чем была продиктована необходимость создания новой системы, ведь в виртуальных читальных залах Российской государственной библиотеки (ВЧЗ РГБ) и во многих других библиотеках уже давно установлен Ваш продукт по обеспечению защищённого просмотра цифровых документов – программа DefView?

— DefView – замечательная система, которая выполняет все задачи, поставленные перед ней изначально, а именно: позволяет постранично просматривать документ, предотвращает несанкционированное копирование текста, предоставляет набор операций со страницами (просмотр, печать, загрузка), обеспечивает функции предпросмотра, масштабирования, поворота и инвертирования цветов страниц документа и т.д. Однако в процессе её активного использования оказалось, что для пользователей важна реализация и других функций, на которые система не была рассчитана – мы получили множество отзывов и предложений по совершенствованию ПО. В связи с тем, что система DefView была построена как монолитное решение, любая доработка вызывала технические сложности. К тому же, с ростом количества клиентов DefView увеличивалось и число серверов хранения данных, контролировать и управлять ими становилось всё труднее. Поэтому встала необходимость создания совершенно нового продукта, в котором можно было бы учесть и пожелания пользователей, и наработанный опыт, и новшества, ставшие доступными с развитием интернет-технологий.

— Как создавалась Vivaldi? Опишите, пожалуйста, этот творческий процесс.

— Разработка системы велась в течение года в условиях полной секретности: мы не участвовали в мероприятиях, не афишировали планы, не докладывали об экспериментах, чтобы не дарить наши идеи возможным конкурентам. Это был замечательный период творчества, принять участие в подобном – мечта многих программистов. У нас возникало множество идей: от безумных до гениальных. Мы пытались отойти от всех существующих догм, чтобы придумать нечто действительно новое. В конечном итоге некоторые идеи были отвергнуты, поскольку они существенно влияли либо на производительность, либо на удобство пользования. Для системы было выбрано оригинальное название – Vivaldi. Великий итальянский композитор Антонио Лючио Вивальди был и очень талантливым дирижёром – он умело управлял большим сводным оркестром, в состав которого входило несколько маленьких. Так и система Vivaldi умело управляет любым количеством серверов и клиентских приложений, массивом цифровых документов разных библиотек, не требуя при этом никакого вмешательства со стороны администраторов.

— На конференции «Электронный век культуры» в 2010 г. Вы впервые заявили о создании Vivaldi, а когда система стала доступна для пользователей?


— С ноября 2010 г. по 1 января 2011 г. ПО функционировало в режиме бета-тестирования. Удивительно, но за первые несколько месяцев было продано больше копий Vivaldi, чем DefView за все годы её существования. Сейчас абсолютно бесплатно на новую систему переведены все наши клиенты, а DefView функционирует только в Российской государственной библиотеке, где, в силу разных сроков действия договоров на открытие виртуальных читальных залов, невозможно осуществить комплексный перевод всех ВЧЗ РГБ на новое программное обеспечение.

—Какие преимущества появились у пользователей новой системы и каковы принципиальные отличия Vivaldi от DefView?

— Самое главное отличие заключается в том, что часть системы управления доступом к документам Vivaldi - программа для защищенного просмотра документов доступна для всех пользователей бесплатно, её можно скачать с сайта http://www.vivaldi.ru/ и установить на любой компьютер. При таком подходе количество рабочих мест в библиотеке не влияет на стоимость договора по полной установке системы. Свобода распространения ПО позволяет также обеспечить библиотеке максимально широкую аудиторию удалённых читателей, обращающихся через сеть Интернет к литературе, не охраняемой законом об авторском праве.

Немаловажно, что ресурсы всех организаций, установивших Vivaldi, интегрируются в единую электронную библиотечную систему, по которой осуществляется сквозной распределённый поиск. Таким образом, читатель, например, Российской государственной библиотеки может в соответствии с правами доступа одновременно работать с текстами других библиотек (рис. 1).

Не указано



Рисунок 1. Вывод результата распределённого поиска в электронно-библиотечной системе Vivaldi

Для пользователей появилась возможность авторизации в системе по единому логину и паролю из разных мест: из дома, из помещения вуза или библиотеки, из любого ВЧЗ. Процесс первичной регистрации, часто отталкивающий потенциальных дистанционных читателей, заменён на ввод данных из систем, в которых пользователь уже имеет учётную запись (рис. 2).
Не указано


Рисунок 2. Аккаунты, данные которых можно использовать при входе в систему

Есть ряд организаций, которые по техническим, финансовым или кадровым причинам не могут позволить себе покупку и обслуживание собственного сервера для электронной библиотеки. Для них доступна новая «облачная» услуга – аренда места на сервере нашей компании.

Для владельцев контента сохранился полный контроль использования документов, при котором можно устанавливать различные уровни доступа к коллекциям и отдельным текстам, определять квоты на просмотр, распечатку страниц, получать подробную статистику по каждому читальному залу. Разработаны вариации заказов: печать цветная, печать чёрно-белая, печать форматом А4, А3, электронное копирование отдельных страниц документов с водяной меткой, копирование без водяной метки и т.д. Реализовано наличие финансовых операций.

Если говорить об интерфейсе пользователя, то здесь практически ничего не изменилось по сравнению с DefView, потому как в данном сегменте ПО есть установленные правила расположения тех или иных функциональных зон. Мы учли, что большая часть пользователей системы – это студенты и аспиранты, часто работающие с литературой в ночное время, поэтому цветовая гамма, применённая в Vivaldi, спокойных, холодных, не раздражающих тонов, есть возможность её инвертирования (рис. 3).
Не указано

Рисунок 3. Интерфейс системы Vivaldi

Архитектура ПО устроена совершенно иначе, чем в DefView. Первая система – монолитная, представляющая единое и неделимое решение; вторая – модульная, состоит из отдельных законченных элементов, структур. Благодаря применённому подходу, Vivaldi получилась гибкой, её можно адаптировать под разные потребности клиентов. Однако, согласно политике компании, во все организации всегда устанавливается полная версия системы, независимо от того, какие функциональные возможности будут в каждом конкретном случае использованы.

— Во скольких организациях сейчас установлена система Vivaldi?

— Все организации, которые используют данную систему, можно условно разделить на три категории. Первая – учреждения, с которыми уже заключён договор на установку ПО, оно настроено и эффективно работает. Вторая – организации, тестирующие сервисы и функциональные возможности Vivaldi на собственных серверах. Руководство этих компаний находится на стадии принятия решения о приобретении системы или отказе от неё, иногда в ожидании поступления финансирования. Третья категория – библиотеки, издательства или вузы, которые знакомятся с системой, не устанавливая её на своё оборудование, а используя наше. Трудно сказать, сколько именно серверов в настоящий момент подключено, потому как система работает автоматически, и нет необходимости их администрировать – мы устанавливаем, настраиваем сервер, а после забываем о нём в хорошем смысле этого слова.

Если руководство организации даёт нам разрешение на индексацию имеющихся у них материалов, то документы этой организации можно найти на центральном сервере нашей системы, расположенном по адресу http://www.vivaldi.ru.

— Есть ли в системе полнотекстовый поиск?

— Полнотекстовый поиск следует разделять на два вида, об этом часто забывают. Первый – поиск по массиву документов с целью выбора нескольких документов из всего массива имеющихся. Второй – поиск по тексту внутри одной книги или статьи в момент, когда этот документ уже открыт для чтения.

На сегодняшний день в Vivaldi доступна возможность поиска только внутри документов. При этом можно искать не только отдельные слова, но и фразы. Поиск осуществляется с учётом морфологии русского языка и позволяет использовать символы подстановки, такие как «*» и «?».

Над обеспечением поиска по текстам всего электронного фонда сейчас активно ведутся работы. Здесь главная проблема заключается в том, что большаячасть электронных документов изначально создавалась в графическом формате, а распознавание текста происходило позже в автоматическом режиме без вычитки редактором и корректорской правки. Около 30% от информации в электронных библиотеках из-за этого содержит ошибки, непечатные символы, в предложениях отсутствуют пробелы и знаки препинания – такой текст нельзя выводить в виде сниппета в результатах поиска. Мы же хотим сделать так, чтобы пользователь мог видеть сниппет вне зависимости от качества его распознавания. Если ту часть страницы, которая содержит три строчки до и три строчки после искомого слова или фразы, отобразить как графический файл, то ошибки распознавания будут не видны, и читатель без труда сможет ознакомиться с найденным контекстом.

— Расскажите, пожалуйста, о ценовой политике Вашей компании.

— Основной нашей целью является установка системы Vivaldi в максимально большом количестве организаций. Для этого мы изначально заложили в систему ряд особенностей: работа серверов без участия администраторов, установка во все организации полнофункциональной версии, полностью автоматическое обновление всех серверов. Планомерно двигаясь к цели, мы установили достаточно невысокую цену на ПО: покупка, установка и настройка системы в среднем стоит 95 тыс. рублей. Однако если электронная библиотека имеет большой массив документов и количество пользователей, или если данные нужно поддерживать одновременно на нескольких серверах, соединённых в кластер, – цена может возрасти. Это касается примерно 20% организаций, для основной же массы региональных вузов и библиотек подключение к системе не обойдётся дороже указанной выше суммы.

— Какова мотивация вузов, издательств и других организаций в установке системы управления доступом к электронным документам?

— Сейчас вузы активно создают электронные библиотеки и электронно-библиотечные системы. Во многих из них накоплен массив собственной методической, учебной и научной литературы по различным дисциплинам. С помощью Vivaldi можно рационально организовать доступ ко всем цифровым документам.

Предоставление студентам цифровых экземпляров книг, конспектов или курсов лекций позволяет решить проблему их малотиражности, а также даёт возможность отслеживать статистику использования отдельных книг. При этом соблюдается гарантия того, что материалы, размещённые в библиотечной системе, защищены от просмотра лицами, не имеющими на то полномочий.

Издательства могут с помощью Vivaldi продавать созданные в цифровом виде произведения или электронные копии газет, журналов, книг.

— Были ли у Вас разработаны другие решения для библиотек?

— Да, очень много было отдельных частных решений, которые ускорили процесс информатизации библиотек, а нам позволили получить бесценный опыт, применённый в создании таких серьёзных систем, как DefView и Vivaldi. В процессе создания этих продуктов мы очень тесно общались с сотрудниками библиотек, что впоследствии позволило нам понимать их потребности на интуитивном уровне. Можно отметить следующие разработки: система Metax, предназначенная для хранения, редактирования и поиска библиографических описаний в формате MARC21; программа CompareMARC, созданная для просмотра сгруппированных библиографических описаний в формате MARC21 с возможностью отбора некоторых описаний из каждой группы; программный модуль MARC SDK, который служит для синтаксического разбора файлов, содержащих библиографические описания в формате MARC21.

— Какие планы по развитию системы поставлены Вами на ближайшую перспективу?

— В настоящее время очень активно идёт работа над обеспечением полнотекстового поиска по массиву документов, о чём я говорил ранее. Также мы работаем над расширением списка поддерживаемых форматов, в первую очередь это графические форматы. Владельцам изображений важно прописать политику ограниченного доступа к материалам, реализуемую, например, установлением просмотра части файла, или возможности просмотра полного файла, но в низком разрешении, или с наложением водяных меток и т.д. В дальнейшем планируется адаптировать Vivaldi к размещению мультимедиа – аудио- и видеоматериалов.