ISTC – новый подход к идентификации, учёту и контролю за электронным контентом
Активное развитие инновационных технологий и появление многочисленных носителей электронной информации, в том числе устройств для чтения электронных книг (ридеров), мобильных телефонов, а также баз данных и online-магазинов э-книг, предоставили новые возможности для авторов, издательств, библиотек по коммерческому использованию контента и предоставлению открытого доступа к нему для конечных пользователей. Вместе с этим, колоссальный рост количества цифровых копий породил ряд проблем для участников всей логистической цепочки. Проблемы возникли на всех этапах – от правовых аспектов по идентификации авторских прав до эффективного поиска, распространения и анализа продаж текстовых работ в электронном виде. В дополнение к этим сложностям добавились многочисленные форматы электронных книг, которые всё ещё сильно зависят от считывающего устройства, в результате чего часто возникает функциональная несовместимость.
Уже сейчас существует острая необходимость в чёткой дифференциации электронного контента для его каталогизации, безошибочного обнаружения и коммерческого распространения по логистическим каналам через посредников к конечным потребителям. Проекты по сканированию архивов библиотек, поиск по оцифрованным книгам Google заставляют все заинтересованные стороны заново обдумывать и определять процессы и процедуры единой библиографической каталогизации, коммерции, а самое главное – контроля в управлении правами на интеллектуальную собственность. В ходе этих процессов неизменным должно оставаться одно – подробные, единые и чётко организованные метаданные, которые отражают главные отличительные признаки контента. Международный стандартный код текстовых произведений (ISTC) имеет огромный потенциал в плане обеспечения общеотраслевой основы для администрирования многих гигабайт цифровой информации.
ISTC: глобальная система идентификации текстовых работ в электронном виде
International Standart Text Code (ISTC), или стандарт ISO 21047, представляет собой систему идентификации авторских произведений в текстовом формате. Эта система ориентирована, прежде всего, на издательст ва, агентства библиографических услуг, розничных торговцев контентом, библиотеки и агентства по контролю за соблюдением авторских прав. Её цель – дифференцировать публикации с одинаковыми названиями в зависимости от типа и уникальности работы.
Коды ISTC разработаны для идентификации текстовых произведений, то есть результатов творческого и/или интеллектуального труда, выраженных полностью или преимущественно в текстовой форме, которые подлежат последующей публикации. Текстовые произведения, содержащие иллюстрации, которые созданы специально для данного текста, либо позаимствованы из другого источника, но считающиеся неотъемлемой частью данного контента, могут также быть зарегистрированы под кодом ISTC.
Произведениям, полностью выраженным посредством графических изображений, код ISTC не присваивается.
Кроме прочих преимуществ, код ISTC даёт возможность сгруппировать информационные продукты со сходным содержанием, а в некоторых случаях и те продукты, которые имеют разное содержание, но относятся к одному исходному материалу. ISTC усовершенствует и улучшит поиск книг и других письменных публикаций, обеспечит соблюдение территориальных прав интеллектуальной собственности участниками логистических каналов, упростит создание и управление сборниками и поможет эффективно проводить анализ коммерческого использования контента.
Коды ISTC разработаны таким образом, чтобы предоставить пользователю подробную информацию о текстовом произведении. Также они могут быть использованы издательствами для сортировки различных изданий с одинаковыми названиями или отдельных глав (частей текстов или статей), под единым названием. Вместо того чтобы искать по всем названиям, под которыми могла быть опубликована одна и та же работа, пользователю теперь нужно знать название только одного издания, ISTC-код которого может быть использован для ссылки на все альтернативные экземпляры данной работы. И наоборот, если у нескольких публикаций одинаковые названия, а их содержание может быть различным, среди результатов поиска можно с лёгкостью обнаружить требуемую работу.
Присвоение кодов ISTC
Код ISTC может быть присвоен текстовому произведению только официально зарегистрированным агентством ISTC. Как правило, это происходит после запроса либо от лица создателя работы, либо его уполномоченного представителя, то есть издателя. Лицо или организация, которая претендует на регистрацию работы под кодом ISTC и предоставляет метаданные для этих целей, называется регистратором.
Каждый ISTC-код представляет собой уникальный номер, который присваивается централизованной регистрационной системой текстовому произведению после того, как будет предоставлен уникальный набор информации о работе, который называется протоколом метаданных. Если другой, идентичный протокол метаданных уже был зарегистрирован (например, в случае публикации авторской работы другим издательством), система посчитает, что новый запрос о присвоении ISTC-кода относится к тому же произведению и выдаст ISTC идентичного (или практически идентичного) протокола метаданных, который уже содержится в системе.
Код ISTC не принадлежит одному автору или издателю, он принадлежит произведению, которое определяет. Это означает, что для идентификации одинакового контента должен использоваться один ISTC-код, даже в том случае, если этот же текст был опубликован разными издательствами и/или в разных форматах публикаций.
При включении кодов ISTC в список атрибутов каждого продукта (например, каждой книги) становится возможным находить конкретный текст среди массы цифровой информации.
Структура кода ISTC и предоставление метаданных
I S T C–0 A 9–2 0 0 9–1 2 B 4 A 1 0 5–7
Код ISTC состоит из 16 символов, которые могут включать арабские цифры от 0 до 9 и латинские буквы от A до F. Сам код складывается из нескольких частей, которые читаются слева направо.
Регистрационный элемент используется регистрационным агентством для административных целей и состоит из 3 символов.
Элемент года длиной в 4 символа отражает год регистрации ISTC-кода. Эта дата не имеет никакого отношения ни к году создания произведения, ни к году, когда оно было впервые опубликовано.
Рабочий элемент состоит из 8 символов. Он присваивается автоматически центральной регистрационной системой кодов ISTC после заполнения протокола метаданными, необходимыми для регистрации, и после того, как система проверила протокол на уникальность.
Контрольный элемент состоит из 1 символа, автоматически генерируемого регистрационной системой ISTC.
Код ISTC всегда начинается с букв «ISTC», с тире или пробелами между элементами.
Код ISTC может быть присвоен определённому текстовому произведению, как только будет предоставлена достаточная информация о нём; произведение не обязательно должно быть издано к этому моменту. Желательно присваивать ISTC код до того, как произведение будет опубликовано, чтобы протокол продукта (например, если речь идёт о книге, которая обычно идентифицируется ISBN) мог включать ISTC в качестве атрибута.
Чтобы зарегистрировать текстовый контент по системе международного кодового стандарта, нужно уникально его описать, чтобы можно было отличить данную работу от любого похожего произведения, которому уже был присвоен код ISTC.
Регистрационная система ISTC принимает метаданные о каждом произведении по схеме ONIX для регистрационных сообщений ISTC. Она основана на стандартах книгоиздательской отрасли в области регистрации информации о продукте, но требует меньшего количества данных и содержит некоторые элементы, которые встречаются только при регистрации ISTC.
Уникальные элементы ISTC включают информацию об источнике произведения. Например, является ли работа абсолютно оригинальной или производной (возможно, переводом или аннотационной версией) другой работы? Эти элементы данных ISTC необходимы, для того чтобы отличать одно произведение от другого, даже если оба имеют одно название и автора. Собирают такие метаданные агентства, регистрирующие ISTС-коды.
В том случае, если произведение является общественным достоянием, регистратором кода может являться третья сторона (например, государственная библиотека).
2. Регистрационный элемент Количество символов – 3 Определяет агентство, зарегистрировавшее код
3. Элемент года Количество символов – 4 Отражает год, в котором произведению был присвоен ISTC-код
4. Рабочий элемент Количество символов – 8 Присваивается автоматически центральной регистрационной системой ISTC после заполнения протокола метаданных, необходимых для регистрации и проверки протокола на уникальность
5. Контрольный элемент Количество символов – 1 Автоматически генерируется регистрационной системой ISTC
ISBN vs ISTC
На протяжении последних десятилетий коды ISBN служили для идентификации печатных текстовых произведений в виде книг. Однако с появлением электронного контента, сложных моделей его дистрибуции и коммерческого использования для достоверной идентификации текстов или их частей в цифровом формате этого кода недостаточно. Код ISBN не предназначен для идентификации текстовых произведений, включая любые физические их воплощения (например, печатные статьи) и электронные форматы (например, электронные книги). Такие текстовые произведения подлежат отдельным системам идентификации.
ISTC включается в протокол продукта для каждого отдельного экземпляра, становится возможным автоматически исключить те экземпляры, для которых доступен территориальный эквивалент с «правами интеллектуальной собственности на одном рынке». В результате библиотеки и библиотечные системы могут легко и корректно автоматически отсортировать публикации, даже если у них разные названия.
Издателям код ISTC позволяет эффективно проводить анализ продаж или количества online-просмотров скопированных текстов (их частей), предоставленных библиотеками читателям.
Статус ISTC
Международное ISTC-агентство (ISTC-IA) было официально зарегистрировано в 2008 г., хотя идеи создания ISTC уходят более чем на десятилетие до того, как стандарт был утверждён и опубликован. В составе учредителей и разработчиков агентства различные представители авторитетных библиографических агентств, в том числе Bowker (США) и Nielsen (Великобритания), и международные ассоциации по управлению и защите прав авторской и интеллектуальной собственности, такие как Международная федерация организаций прав воспроизведения (IFFRO) и Международная конфедерация сообществ авторов и композиторов (CISAC).
В 2009 году компании Bowker, Nielsen, «МВБ Маркетинг» (Marketing und Verlagsservice des Buchhandels GmbH) (Германия), Cercle de la Librairie-Electre (Франция) в официальном порядке заявили о начале работы с Международным ISTC-агентством. Это означает, что в ближайшем будущем на рынках всего мира будут учреждены многочисленные дополнительные регистрационные агентства, для каждого из которых будет утверждена миссия деятельности в соответствующем направлении и на определённой территории. Многие библиографические агентства уже применяют коды ISTC в качестве дополнительного средства поиска по текстовым продуктам, содержащим одинаковый и/или очень схожий контент в рамках библиографических баз данных. Их конечная цель – облегчить поиск среди устаревших, дос тупных в данный момент и анонсированных текстов, более эффективно осуществлять анализ продаж при соблюдении интересов издательств и клиентов библиотек.
Важная веха, достигнутая агентством ISTCIA в 2009 году – это представление бета-версии Системы стандартов регистрации текстов (STRS). Её будут использовать регистрационные агентства, чтобы упростить присвоение ISTC-кодов в интересах регистраторов. Система STRS продолжает совершенствоваться, чтобы соответствовать новым, постоянно возникающим функциональным требованиям. Основная задача этой системы – обработка метаданных и корректное присвоение ISTC-кодов при условии использования качественных данных и схемы ONIX. Посредничество, взаимодействие и поддержка бизнес-аналитиков и аналитиков массивов данных продолжает активно распределяться от Международного агентства ISTC-IA к официальным регистрационным агентствам ISTC с целью обеспечения максимально возможного уровня пунктуальности и точности. Ведь точные текстовые совпадения между оригинальными произведениями и их копиями бывает сложно подтвердить на базе одних только метаданных. В будущем, возможно, система будет усовершенствована и включит более передовые механизмы для проверки совпадений в текстовых произведениях.
Некоммерческое партнёрство правообладателей и пользователей «Федерация интеллектуальных прав» (НП «ФИПР») официально утверждено в качестве единственного уполномоченного агента по присвоению международных ISTC-кодов на территории Российской Федерации для всего контента на русском языке. Таким образом, Россия вошла в пятёрку ведущих стран, регистрирующих ISTC.
Обзор сделан по официальным материалам международного агентства ISTC