Информационная система «Стенографические отчеты Государственной Думы, 1906–1917»: задачи и возможности комплексного историко-ориентированного ресурса
Актуальной задачей развития современной информационной среды исторической науки и образования является создание тематических ресурсов [1]. Содержательную основу таких ресурсов могут составлять комплексы электронных версий исторических источников, а одним из вариантов их организации могут выступать информационные системы на основе баз данных.
В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в обеспечении хранения информации в памяти компьютера, выполнении специфических преобразований информации и предоставлении интерфейса [2]. Существующие историко-ориентированные базы данных и информационные системы различаются:
• набором используемых технологий и программного обеспечения для организации и представления данных;
• типами используемых источников: различные виды источников по определенной тематике или заданный массив источников (коллекция номеров периодического издания и т.п.);
• режимом использования: локальный продукт или Интернет-доступ;
• функциональными возможностями информационной системы по обеспечению выполнения запросов, поиска информации и т.п.
Создание историко-ориентированных информационных систем и их применение в исследовательской и образовательной сферах является ведущим направлением в деятельности лаборатории исторической и политической информатики историко-политологического факультета Пермского государственного университета. Начиная с 2003 г., сотрудники лаборатории при поддержке научных фондов реализовали ряд проектов в данной области: «Информационная система “Российские парламентарии начала XX века”» , «Журналы земских собраний как источник изучения истории местного самоуправления в России (II половина XIX – начало XX в.)» , «Источниковедческий анализ газеты “Пермские губернские ведомости” (XIX – начало XX в.) на основе применения новых компьютерных технологий» , продолжается реализация таких проектов, как «Газета “Пермские губернские ведомости” 1838–1844 гг.: проблемы источниковедческого исследования и сохранения историко-культурного памятника» и «Информационная система “Стенографические отчеты Государственной Думы, 1906–1917”».
Информационные системы, созданные в рамках указанных проектов, отличают полнотекстовость, источнико-ориентированность, кросс-платформенность, web-интерфейс, многозадачность. Акцент на подобных характеристиках обусловлен теоретическими изысканиями, накопленным опытом реализации историко-ориентированных систем, пониманием потребностей современной исторической науки.
Создание историко-ориентированной информационной системы, направленное на достижение цели конкретного проекта, предполагает решение ряда теоретических и прикладных задач. В некоторых случаях эти задачи, выполняя вспомогательную функцию в рамках конкретного проекта, могут приобрести и самостоятельное, выходящее за рамки проекта, значение.
На примере информационной системы «Стенографические отчеты Государственной Думы, 1906–1917» рассмотрим наиболее важные задачи, решаемые при проектировании и реализации историко-ориентированной информационной системы, а также те возможности, которые открывает уже созданная система для дальнейших исследований.
1. Информационная система как способ сохранения письменного историко-культурного наследия
Сохранение историко-культурного наследия является одной из приоритетных задач международного сотрудничества, государственной и региональной политики. Ухудшение физического состояния некоторых исторических источников, перспектива их частичной или полной утраты требуют незамедлительного переноса их формы и содержания на другие носители. Вообще задача сохранения исторического источника, связанная с физическим разрушением его носителя, может быть решена, например, путем фотографирования источника с последующей распечаткой снимков или создания графического цифрового изображения. Однако и разработка полнотекстовых источнико-ориентированных информационных систем в качестве первостепенной задачи также требует создания электронных версий источника, которые в дальнейшем будут заведены в базу системы. Тем самым это позволяет решать задачу сохранения исторического и культурного наследия.
В основе проекта «Информационная система “Стенографические отчеты Государственной Думы, 1906–1917”» лежит понимание стенографических отчетов как основного источника по истории российского парламентаризма, содержащего важную информацию о деятельности Государственной Думы дореволюционной России и парламентской активности думских фракций и отдельных депутатов. Между тем, изданные в 1906-1917 гг. тома стенографических отчетов к настоящему времени стали библиографической редкостью, а их физическое состояние заметно ухудшается во всех книгохранилищах. Таким образом, уже необходимость сохранения данного источника обуславливает актуальность решения задач перевода его в машиночитаемый формат. Перевод осуществляется посредством сканирования с последующим распознаванием. Для хранения и визуализации источников принята концепция его двухформатной репрезентации: формат PDF для обеспечения максимально идентичного с источником изображения (штемпели, оригинальный шрифт и пр.) и текстовый формат.
2. Информационная система как средство расширения доступа к источнику
Информационная система наряду с физическим сохранением письменного источника позволяет решить и задачу расширенного доступа к нему, его эффективного использования. При этом использование системы в локальной сети уже повышает доступ к тем источникам, физическое состояние которых не позволяет продолжать их изучение на основе традиционных техник. Так, указанные выше проекты лаборатории исторической и политической информатики ПермГУ реализовывались в сотрудничестве с Российской государственной библиотекой, Пермским краевым музеем и Пермской краевой библиотекой. Электронные копии коллекций источников, на основе которых они создавались, переданы в эти центры, благодаря чему обеспечены условия для использования данных источников и расширены возможности доступа пользователей к ним.
Однако задача перевода исторических источников в электронный формат и обеспечения широкого доступа к историческим источникам актуальна и в том случае, когда их физическое состояние удовлетворительно – информационная система, размещенная в интернете, обеспечивает удаленный доступ к источнику самому широкому кругу пользователей. Среди прочего и это призван обеспечить проект «Стенографические отчеты Государственной Думы, 1906–1917». Его реализация предполагает создание первой полнотекстовой базы данных стенографических отчетов Государственной Думы Российской империи всех четырех созывов и ее размещение в сети Интернет.
Информационные системы позволяют также собрать в единую коллекцию массивы источников, части которых хранятся в различных местах.
3.Историко-ориентированная информационная система как методологическая проблема
Реализация проектов, основной целью которых является оцифровка конкретного массива источников и создание на его основе информационной системы, неизбежно предполагает решение ряда методологических проблем.
Среди них рассмотрение исторических источников в свете информационного подхода. Идея применения теории информации для анализа исторических источников высказывается в работах И.Д. Ковальченко [3] в 70–80-х гг. XX в. В свете информационного подхода информационная сущность исторического источника (речь идет, в основном, о письменных источниках) состоит в том, что информация содержится не только в тексте, но и в носителе источника, в контексте, в личности создателя, в эпохе создания, в том, как источник хранился, кому был адресован и т.д. Исторический источник является результатом информационных процессов – отбора, переработки, хранения и передачи информации, а историк, работая с источником, также совершает информационный процесс – интерпретацию источника (с учетом его информационной сущности). В результате историком создается новая информация – историографический источник, который, вообще говоря, также имеет свою информационную сущность, аналогичную описанной выше, и должен рассматриваться в контексте этой сущности. Задача историка при работе с источником – анализ его информационной сущности, в том числе извлечение скрытой информации.
Создание полнотекстовых историко-ориентированных информационных систем позволяет наиболее полно реализовать основные положения информационного подхода к историческим источникам.
При создании информационных систем решаются такие методологические вопросы, как подходы к построению модели источника, этапы и правила построения модели, требования к традиционному источниковедческому анализу исторического источника как основе для созданий его информационной модели и другие. Источниковедческий анализ источника является важным условием эффективного решения задачи создания историко-ориентированной информационной системы, в основе которой лежит рассматриваемый источник. При этом источниковедческий анализ как основа разработки информационной системы должен базироваться как на традиционном, так и компьютерном источниковедении [4].
Одна из проблем, которые необходимо решать при создании электронных версий исторических источников и основанных на них систем – проблема документирования источников, включающая разработку структуры и форматов описания. Эти вопросы применительно к конкретной системе представляются актуальными с точки зрения решения общей проблемы документирования исторических ресурсов (в т.ч. источников), не разработанной сегодня на должном уровне.
4. Источниковедческий анализ как этап создания информационной системы
Максимально полную передачу облика и структуры документов, содержательную полноту источника, а значит, универсальность создаваемой информационной системы, с точки зрения ее научного использования, обеспечивает источнико-ориентированный подход. Вместе с тем, предоставление удобного доступа к информации, возможности выполнения поисково-аналитических запросов обуславливает необходимость не только наличия электронных копий, наиболее близких к источнику, но и решения задачи эффективной организации источниковой информации.
Разработка и практическая реализация наиболее оптимальных путей, методов, средств и формы перевода источника в машиночитаемый формат в качестве одного из важнейших этапов предполагает всесторонний источниковедческий анализ ее оригинала на структурно-логическом и содержательном уровнях [5].
Результаты такого анализа являются основой разработки информационной модели электронной версии источника и на ее основе – структурирования и атрибуции источника в базе данных информационной системы. Данная модель станет основой для создания базы данных и других компонентов информационной системы, выбора наиболее целесообразных форм организации и визуализации данных. На ее основе будет создана ER-модель системы, сформулированы технические условия и задачи ее реализации.
То есть традиционный источниковедческий анализ на начальном этапе создания системы определяет концепцию и логику ее построения. Одновременно он является ценным и сам по себе: на достаточно высоком уровне решается важная с точки зрения исторической науки задача всестороннего источниковедческого анализа исторического источника или их комплекса.
5. Информационная система как часть тематического историко-ориентированного комплекса
Информационная система, в основе которой лежит некоторый источниковый массив, может быть элементом-модулем более крупной системы, объединяющей системы нескольких источниковых массивов по определенной тематике. Такая система может стать основой для системного изучения исторических событий, процессов и явлений.
Рассматривая историю парламентаризма в России, можно выделить несколько групп источников, в том числе в качестве важнейших – указатели к стенографическим отчетам Государственной Думы. На основе машиночитаемых версий этих источников в 2003-2004 гг. была создана информационная система «Российские парламентарии начала XX века». Система позволяет проводить просопографические исследования, выделять и соотносить социокультурные параметры думцев и показатели их парламентской активности, моделировать коллективный портрет депутатского корпуса.
Осуществление проекта «Стенографические отчеты Государственной Думы, 1906–1917» позволит создать уникальный историко-ориентированный источниковый комплекс, основанный на модели, обеспечивающей взаимосвязь между двумя группами основополагающих исторических источников по рассматриваемой проблематике и позволяющей изучать их один через другой и синхронно. Эти системы станут основой информационно-аналитического Интернет-портала «Российский парламентаризм начала XX века», который среди прочего впервые обеспечит возможность анализа указанных источников как «единого текста». Это позволит раскрыть их информационный потенциал на качественно новом уровне.
6. Информационная система как содержательная и технологическая база для исторических исследований
Сохранение историко-культурного наследия и предоставление исследователям доступа к нему обеспечивает источниковую базу для традиционных исторических исследований. Однако полнотекстовая информационная система является не только содержательной, но и технологической основой для компьютеризированных исторических исследований. В случае с информационной системой «Стенографические отчеты Государственной Думы, 1906–1917» это выражается в следующем.
Во-первых, информационная система обеспечивает доступ к полному корпусу источников, при этом массив источников (свыше 30 томов стенографических отчетов) может анализироваться как «единый текст». Отсутствие возможности работать со всем массивом изучаемых источников значительно усложняет работу исследователей, а в некоторых случаях делает невозможным полномасштабный и комплексный анализ деятельности парламентского учреждения дореволюционной России.
Во-вторых, информационная система с полнотекстовым представлением источников создает возможности для более всестороннего и глубокого изучения парламентской истории России на основе применения количественных методов, включая многомерный статистический анализ и различные типы контент-анализа текста. Таким образом, применительно к данному кругу источников создаются реальные условия для более полного раскрытия их информационного потенциала, извлечения скрытой, недоступной при использовании традиционных методов обработки, информации.
В-третьих, информационная система включает приложения и интерфейсы для осуществления запросов информационно-поискового и аналитического характера, ориентированных на исследование основных проблем состояния, структуры и деятельности Государственной Думы и ее депутатского корпуса. При этом предполагается возможность запросов по основным атрибутам источника, его структурным элементам, ключевым словам, персоналиям, географическим объектам, тематическим рубрикам. Предусматривается возможность контекстного поиска с обработкой отдельных стенографических отчетов, групп источников, принадлежащих тому или иному временному интервалу, по всему массиву коллекции.
7. Информационная система как образовательный ресурс
Сохранение историко-культурного наследия средствами информационных технологий позволяет более активно и эффективно использовать его в образовательных и просветительских целях. В учебном процессе информационная система может применяться, с одной стороны, как источник информации, с другой – как средство компьютеризированного анализа исторических данных и визуализации его результатов. Различными могут быть формы и виды учебной деятельности: использование системы при объяснении нового материала, осуществлении учебно-исследовательских проектов, организации самостоятельной работы обучаемых.
Использование историко-ориентированных информационных систем и баз данных может способствовать росту познавательной активности учащихся, их мотивации к изучению истории и овладению современными информационно-коммуникационными технологиями. Организация учебного процесса на основе информационных систем создает благоприятные возможности для формирования навыков и умений самостоятельной работы с историческими источниками, извлечения из них необходимой информации, ее аналитической обработки, представления учебного материала и результатов учебной деятельности в более наглядном и доказательном виде. Все это позволяет говорить о том, что внедрение историко-ориентированных информационных систем и методов обучения, основанных на технологии баз данных, способствует повышению эффективности учебного процесса.
Таким образом, в процессе создания информационной системы «Стенографические отчеты Государственной Думы, 1906–1917» решаются такие актуальные проблемы, как сохранение, документирование и расширение доступа к историко-культурному наследию; применение информационного подхода к сохранению и анализу исторических источников; проектирование и создание историко-ориентированных тематических ресурсов, баз и банков данных, содержащих электронные копии исторических источников; организация, хранение и визуализация исторической информации на современных электронных носителях; создание возможностей для более эффективного использования исторических источников в научных и образовательных сферах.
Представляется, что основные положения, сформулированные для указанной информационной системы, в той или иной степени могут быть распространены и на другие историко-ориентированные информационные системы, основанные на массивах исторических источников.
Литература
1. Бородкин Л.И. Историческая информатика в точке бифуркации: движение к Historical Information Science // Круг идей: алгоритмы и технологии исторической информатики: тр. IX конф. АИК / ред. Л.И. Бородкин и В.Н. Владимиров. – Москва; Барнаул, 2005. – С. 7-21.
2. Кузнецов С.Д. Основы современных баз данных [Электронный ресурс] – Режим доступа: http://www.citforum.ru/database/osbd/contents.shtml
3. Ковальченко И.Д. Исторический источник в свете учения об информации // История СССР. – 1982. – №3. –– С. 129-148.
4. Кирьянов И.К., Корниенко С.И. Указатели к стенографическим отчетам Государственной Думы как основа для создания электронных источников по истории парламентаризма в дореволюционной России // Информационный бюллетень ассоциации «История и компьютер». – 2003. – № 32. – С. 100-102.
5. Пигалева С.В., Корниенко С.И., Гагарина Д.А., Горбачева Н.Г. Газета «Пермские губернские ведомости» (1838 – 1844 гг.): традиционный источниковедческий анализ и информационные технологи // Вестник Пермского университета. Серия История. – 2008. – Вып. 7(23). – С. 72-76.