Базы данных ГПНТБ СО РАН: востребованность через интернет, поисковые стратегии пользователей
Библиографические базы данных по истории, экономике, науке, культуре, природе и природным ресурсам Сибири и Дальнего Востока создаются в ГПНТБ СО РАН Отделом научной библиографии с конца 80-х годов 20-го века для информационного сопровождения научных исследований Сибирского отделения РАН. В настоящее время сформировано более 40 электронных ресурсов по Сибири и Дальнему Востоку, составляющих уникальную систему региональной научной библиографии. С 1997 года региональные библиографические БД представлены в интернете в информационно-поисковой системе ГПНТБ СО РАН под управлением программы WWWISIS [1-3].
Создав информационный ресурс и предоставив его пользователю (читателю в стенах библиотеки, пользователю интернета), необходимо перманентно отслеживать параметры его функционирования. Такой мониторинг позволяет анализировать тематическую структуру информационных потребностей пользователей и динамику их (потребностей) изменений, выявлять недостатки интерфейса информационно-поисковых систем, через которые ресурсы представляются пользователю и т.д. Данное исследование проведено с целью выявления потребительской структуры восьми ресурсов собственной генерации ГПНТБ СО РАН, а также поисковой стратегии их пользователей при обращении через интернет. Объектом исследования являются библиографические БД по Сибири и Дальнему Востоку с еженедельным пополнением:
1. БД «Природа и природные ресурсы Сибири и Дальнего Востока» (с 1988 г.); более 220 тыс. записей; тематические разделы: геология, климат, водные ресурсы, почвы, растительный мир, животный мир, ландшафты, охрана природы, экология человека;
2. БД «История Сибири и Дальнего Востока» (с 1991 г.); около 100 тыс. записей; тематические разделы: историческая наука и вспомогательные дисциплины, история народного хозяйства, культуры, географических исследований, историческое краеведение, археология;
3. БД «Экономика Сибири и Дальнего Востока» (с 1990 г.); около 100 тыс. записей; тематические разделы: статистика, проблемы развития и размещения производительных сил, демография и трудовые ресурсы, внешнеэкономические связи;
4. БД «Литература, искусство Сибири и Дальнего Востока» (с 1991 г.); более 50 тыс. записей; тематические разделы: литература, фольклор, искусство (архитектура, живопись, графика, скульптура, кино, телевидение, театр, музыка и т.д.);
5. БД «Наука в Сибири и на Дальнем Востоке» (с 1992 г.); более 30 тыс.; тематические разделы: история развития академической и вузовской науки, отдельные отрасли наука, научные кадры, целевые комплексные научно-технические программы, информационное обеспечение науки, международные связи науки;
6. БД «Коренные малочисленные народы Севера» (с 1989 г.); около 15 тыс. записей; тематические разделы: культура, история, происхождение народов, правовая и социальная основа существования;
7. БД «Проблемы Севера» (с 1988 г.); около 170 тыс. записей; тематические разделы: история освоения, природные ресурсы, развитие отдельных отраслей, сельское хозяйство, техника и технологии, экономические, экологические, социальные, медико-биологические проблемы;
8. БД «Устойчивое развитие природы и общества» (с 1992 г.); более 60 тыс. записей; тематические разделы: исторические и современные философские, правовые, экономические вопросы, экономические, экологические, социальные проблемы на примере Сибири и Дальнего Востока, информационное обеспечение проблем устойчивого развития.
БД содержат библиографические описания около 745 тысяч научных, научно-популярных, справочных, печатных и электронных изданий (документов), поступивших в ГПНТБ СО РАН в качестве обязательного экземпляра, по подписке, книгообмену. Это книги, сборники, авторефераты диссертации, а также статьи из сборников, журналов, газет и материалы конференций, содержащие информацию по темам. Библиографическое описание документов сопровождаются тематическими, предметно-географическими рубриками и аннотациями (при необходимости пояснения тематических, предметно-географических рубрик).
Региональные БД многоаспектно представляют информацию по Сибири и Дальнему Востоку и активно используются для подготовки указателей литературы, информационно-библиографического обслуживания (справочного и по системе избирательного распространения информации (ИРИ)) [4], библиометрических исследований информационных потоков [5].
Анализ числа обращений пользователей к БД через интернет за 1998-2010 гг. выявил ряд закономерностей. Из восьми БД наиболее востребованными у пользователя являются «История Сибири и Дальнего Востока» (34%) и «Природа и природные ресурсы Сибири и Дальнего Востока» (22%). Обращения к ним составляет более половины (57%) от общего числа обращений ко всем восьми региональным ресурсам с текущим пополнением. Менее половины (43%) от общего числа составили обращения к группе БД: «Экономика Сибири и Дальнего Востока» (10%), «Проблемы Севера» (10%), «Литература Сибири и Дальнего Востока» (9%), «Наука в Сибири и на Дальнем Востоке» 8%), «Устойчивое развитие природы и общества» (4%), «Коренные малочисленные народы Севера» (3%) (таблица 1).
Таблица 1.
Статистические данные по обращению к 8-ми региональным базам данных при поиске информации в WEB-ориентированной информационно-поисковой системе
ГПНТБ СО РАН (1998-2010 гг.)
В информационных ресурсах библиотеки, представленных в интернете через программу WWWISIS, пользователь может:
• проводить поиск в четырех режимах - «Простой», «Стандарт», «Эксперт», «Мультипоиск»;
• использовать стандартный набора словарей - «Тематический рубрикатор», «Вид, характер документа», «Ключевые слова», «Географические рубрики», «Автор, редактор, составитель», «Заглавие», «Заглавие-источник статьи», «Коллективный автор», «Год издания», «Место издания», «Издательство», «Язык», «Страна»;
• составлять поисковый запрос по одному или нескольким словарям с использованием булевых операторов: OR, AND, AND NOT.
Пользователю предлагается ясная и логичная поисковая система, в которой в зависимости от задачи можно искать информацию по одному или нескольким словарям из стандартного набора, составить сложное поисковое предписание, редактировать поисковое предписание, проводить поиск по нескольким или всем ресурсам библиотеки.
Таблица 2.
Статистические данные по использованию режимов поиска информации в 8-ми
региональных базах данных с текущим пополнением (WEB-ориентированная
ИПП ГПНТБ СО РАН под управление, 1998-2010 гг.)
Проведенное нами исследование стратегий поиска информации показало, что 61% всех обращений к региональным библиографическим БД составили обращения через режим «Стандарт». Через режимы «Простой», «Эксперт» и «Мультипоиск» поиск производился соответственно в 13%, 12%, 14% случаев. При использовании режимов «Стандарт», «Эксперт» и «Мультипоиск» пользователи могли проводить сложный поиск, составив поисковое предписание, и даже редактировать и сохранять поисковое предписание при использовании режима «Эксперт». Отсутствие активного использования режимов «Эксперт» и «Мультипоиск» может быть объяснено недостаточной подготовленностью пользователей в составлении запросов с использованием элементов булевой алгебры, когда их нужно составлять «вручную», самостоятельно подбирая термины запроса и разделяя их логическими операторами. Следует также отметить, что при использовании режима «Мультипоиск» в исследуемой ИПС могли возникать затруднения: система не справлялась с объемом информации при выборе всех или большого числа ресурсов ГПНТБ СО РАН. Очевидно также, что число пользователей, нуждающихся в информации из нескольких БД, не столь велико в сравнении с числом пользователей, интересующихся информацией более узкой тематики, представленной в одной из БД (таблица 2).
Исследование алгоритмов поиска по словарям (поисковым полям) показало, что чаще всего в 8-ми региональных БД (64% обращений) поиск информации проводили: по ключевым словам (32%), авторам (16%), заглавию (14%). Менее четверти (36%) обращений зарегистрировано к словарям: «Географические рубрики» (12%), «Тематические рубрики» (10%), «Год издания» (8%), «Место издания» (4%) и «Издательство» (4%) (таблица 3).
Таблица 3.
Статистические данные по использованию словарей при поиске информации в 8-ми региональных базах данных с текущим пополнением информации (WEB-
ориентированная ИПП ГПНТБ СО РАН, 1998-2010 гг.)
Несмотря на разнообразные поисковые возможности системы, при обращении к исследуемым базам данных преобладали запросы по одному словарю, содержащие один термин (78%). Поисковые предписания с использованием нескольких терминов одного словаря или несколько словарей составили 22% от общего числа запросов (таблица 4).
Таблица 4.
Статистические данные по использованию элементов булевой алгебры при поиске информации в 8-ми региональных базах данных с текущим пополнением (WEB-ориентированная ИПП ГПНТБ СО РАН, 1998-2010 гг.)
Анализ статистических данных поискового поведения при обращении к региональным БД с текущим пополнением позволяет сформулировать следующие выводы:
- особое внимание необходимо уделять наполнению поискового словаря «Ключевые слова»;
- информация о ресурсе (описание), набор поисковых словарей и формы их представления должны в полной мере давать информацию об особенностях ресурса и правильно ориентировать пользователя.
Как известно, ключевые слова, особенно ненормируемые, не всегда передают тематику документа. В составе лингвистического обеспечения библиографических БД для создания наиболее полного поискового образа документа, помимо ключевых слов, используется несколько языков (ГРНТИ, предметные рубрики, нормируемые ключевые слова). К их числу относятся язык предметных рубрик. Поскольку поиск по ключевым словам является наиболее часто используемой стратегией пользователей рассмотренных БД, следует в автоматизированных информационных системах организовывать лингвистические процессы таким образом, чтобы в состав ключевых слов включались и лингвистические единицы предметных рубрик.
Выполненное исследование имело большое значение при выборе направления модернизации рассмотренных БД. Предполагается создать на их основе обновленный интегрированный ресурс, представить его в информационно-поисковой системе библиотеки через программу WEB-ИРБИС. В дальнейшем результаты данного исследования будут использованы для выяснения влияния модернизации рассмотренных БД на показатели функционирования нового ресурса.
Литература:
1. Перегоедова Н.В., Бусыгина Т.В. Направления модернизации работы ГПНТБ СО РАН в помощь сибирской науке // Библиография. - 2010. - N 5. - С. 35–42.
2. Балуткина Н.А., Бусыгина Т.В., Перегоедова Н.В. Библиографические базы данных собственной генерации ГПНТБ СО РАН: пути модернизации с целью совершенствования их потребительских свойств [Электронный ресурс] // Библиотечное дело - 2011: библиотечно-информационная деятельность в условиях модернизации общества: материалы XVI междунар. науч. конф. (Москва, 27-28 апреля 2011 г.). - Электрон. дан. - М., 2011. - 1 электрон. опт. диск (CD-ROM). - Систем. требования: IBM PC, Windows 2000 или выше. - Загл. с этикетки диска.
3. Бусыгина Т.В., Перегоедова Н.В., Балуткина Н.А. Формирование собственных электронных библиографических ресурсов ГПНТБ СО РАН: технологические аспекты, проблемы доступа // Труды ГПНТБ СО РАН. – Новосибирск, 2011. - Вып. 1: Развитие электронной информационно-библиотечной среды. – С. 40–48.
4. Балуткина Н.А., Крюкова Н.Ю. Информационное обслуживание потребителей в режиме избирательного распространения информации в современных условиях: проблемы и перспективы // Электронные ресурсы библиотек региона: материалы регион. науч.-практ. конф. (г. Новосибирск, 24-28 сент. 2007 г.). - Новосибирск, 2008. - С. 183–190.
5. Балуткина Н.А. Региональные базы данных ГПНТБ СО РАН как источник библиометрического анализа // Состояние и развитие основных направлений научных исследований: библиометрический анализ: Сб. науч. тр. - Новосибирск, 2003. - С. 17–30.