Российский и международный опыт вебометрических исследований
О терминах
20 лет назад, после появления браузера Mosaic, интернет стал всеобщим достоянием. У организаций, а затем и у частных лиц стали появляться веб-сайты. Тогда не было речи ни о какой корреляции между качеством сайта и достоинствами его владельцев (размером компании, заслугами частного лица). Ветераны интернета хорошо помнят время, когда ЗиЛ, Газпром, Норильский никель, Сбербанк сайтов не имели вовсе, в то время как у небольших студий веб-дизайна были великолепно оформленные, полнофункциональные сетевые представительства.
Большинство руководителей не осознавало необходимость информационной открытости и не задумывалось о регистрации собственных доменных имен (впоследствии это породило такое явление как киберсквоттинг). Положение стало меняться в нынешнем веке. Коммерческие фирмы поняли, что хороший сайт создает существенные конкурентные преимущества. Были приняты нормативные документы, обязывающие государственные организации иметь веб-сайты.
Появившееся колоссальное количество сетевых информационных ресурсов вызвало потребность их упорядочения и анализа. Вслед за библиометрией и наукометрией возникла вебометрия (вебометрика). Термин «webometrics» был введен Алмайндом и Ингверсеном в 1997 году [1].
Процитируем «Википедию».
«Вебометрика (англ. webometrics) это раздел информатики, в рамках которого исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к Всемирной паутине. Вебометрика является одной из составляющих инфометрии. Кроме того, вебометрика связана с библиометрией и в определенной степени пересекается с наукометрией.
Инфометрия — научная дисциплина, предметом которой являются количественные измерения хранимой и используемой информации.
Библиометрия — научная дисциплина, занимающаяся изучением документов на основе количественного анализа первичных и вторичных источников информации с помощью формализованных методов с целью получения данных об эффективности, динамике, структуре и закономерностях развития исследуемых областей.
Наукометрия — научная дисциплина, занимающаяся изучением количественных методов развития науки как информационного процесса.
Киберметрия — научная дисциплина, занимающаяся количественным анализом новых возможностей по обработке информации, хранимой в электронном виде, и ее визуализации» .
Встречаются и несколько иные подходы к трактовке этого понятия.
Вебометрия 1) статистика веб-сайтов; 2) область, изучающая с помощью библиометрических методов характер и свойства сети Веб .
Вебометрика изучение количественных аспектов создания и использования информационных ресурсов, структур и технологий в Сети на основе библиометрического и информетрического подхода .
Вебометрика включает как минимум четыре основных направления исследований:
• веб-индикаторы (индексы цитирования, наблюдаемость сайтов и т.д.),
• социальные феномены в Сети (социальные сети, сообщества сайтов),
• сбор данных о Сети (роботы, краулеры, поисковые машины, информационный поиск),
• анализ гиперссылок (в частности, связи между сайтами вузов и научных организаций).
И еще один, менее распространенный термин. «Вебология отрасль знания, изучающая разные аспекты веб-сайтов: их структуру, организацию, типологию, функции, характеристики, ссылки и их развитие» . В настоящее время вебология находится на экспериментальном этапе своего развития. В американском колледже Northern Mariana College некоторое время существовал факультет для изучения World Wide Web (The department of Webology).
С августа 1994 г. по настоящее время издается журнал Webology .
Нормативные документы
Как известно, одним из основных атрибутов современной демократии является свободный доступ граждан к официальной информации, созданной на средства налогоплательщиков. Важнейшим средством доступа является интернет.
12 февраля 2003 г. премьер-министр М.М.Касьянов подписал постановление № 98 «Об обеспечении доступа к информации о деятельности правительства РФ и федеральных органов исполнительной власти», которое предписывало размещать на сайтах ведомств 36 видов информации. 98-е постановление так и не было выполнено в полном объеме, однако оно подготовило почву для последующих документов. 1 января 2010 г. вступили в силу федеральный закон № 8-ФЗ от 9 февраля 2009 г. «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления» и постановление № 953 от 24 ноября 2009 г. «Об обеспечении доступа к информации о деятельности правительства Российской Федерации и федеральных органов исполнительной власти». Граждане получили возможность запрашивать в электронном виде информацию о деятельности государственных органов, в том числе сведения о расходовании бюджетных средств, регламентах работы и пр. Закон устанавливает перечень сведений, подлежащих размещению в интернете. В развитие закона в августе 2011 года появились 19 указов, которые утверждают перечень размещаемой в интернете информации о деятельности федеральных министерств и ведомств, подчиненных президенту – МВД, Минобороны, СВР, ФСО и других. Подробнее об этом см. [2,3].
Для образовательных учреждений необходимость иметь официальные сайты вытекает из ст. 32 закона РФ № 3266-1 «Об образовании» от 10 июля 1992 г. (в современной редакции). Требования к информации регламентируются правительственным постановлением от 10 июля 2013 г. № 582 «Об утверждении Правил размещения на официальном сайте образовательной организации в информационно-телекоммуникационной сети "Интернет" и обновления информации об образовательной организации» и письмом Минобрнауки от 22 июля 2013 г. № 09-889 «О размещении на официальном сайте образовательной организации информации».
Выполнение указанных требований находится под постоянным контролем государственных и общественных организаций. В соответствии с постановлением правительства Российской Федерации от 24 ноября 2009 г. № 953 Минэкономразвития России ежегодно проводит мониторинг официальных сайтов федеральных органов исполнительной власти; оно же анализирует информационное наполнение официальных сайтов органов государственной власти субъектов Российской Федерации. Согласно методике министерства, «показатель информационной открытости» ежегодно улучшается на 10-15%; еще лучше, на 20%, растет «показатель технологического совершенства» .
Намного раньше официальных органов мониторингом сайтов стали заниматься негосударственные организации; здесь один из признанных лидеров Институт развития свободы информации и его проект «Инфометр» (в августе 2014 г. права на реализацию проекта были переданы ООО ИРСИ). Начиная с 2004 года, ими проводятся исследования официальных сайтов органов власти. Авторы исследования видят свои задачи в том, чтобы «дать оценку состоянию официальных порталов, оценить уровень открытости/закрытости конкретных ведомств и государства в целом, предрасположенности органов власти к коррупции, а также оценить возможности граждан в доступе к информации о деятельности государственных органов и органов местного самоуправления». Их работа объективно повышает возможности получения гражданами информации о деятельности государственных органов и органов местного самоуправления и делает эту информацию более полной, актуальной и удобной для восприятия.
Об оценках сайтов
Сравнения сайтов и оценки их качества выполняются более 20 лет. В ноябре уже далекого 1996 года состоялся семинар Регионального общественного центра интернет-технологий (РОЦИТ) «Что такое хороший веб-сайт», на котором обсуждались вопросы соотношения оформления и содержания, влияния платформы, на которой созданы сайты, на их качество, приводились примеры «плохих» сайтов. Основные претензии были связаны с непродуманной эргономикой, нечитаемостью текстов (например, желтые буквы на светло-зеленом фоне), медленным обновлением информации, низким уровнем грамотности, изобилием фактических ошибок как случайных, так и намеренных. (Замечу в скобках, на том семинаре РОЦИТ моему сообщению ассистировал почти никому не известный 21-летний веб-дизайнер А.Лебедев, листавший на компьютере страницы с примерами «от противного».)
Через десять с лишним лет в проекте рейтингового агентства БГУ «Вебометрический рейтинг белорусских банков» банковские сайты оценивались по пяти «микроиндексам»: дизайн, содержание, навигация (юзабилити), онлайн-сервис и раскрученность с весовыми коэффициентами 0.2, 0.23, 0.29, 0.16 и 0.12 соответственно.
Выше фигурировали в основном трудноформализуемые качественные показатели; чтобы по ним сравнивать сайты, необходимо собирать и обрабатывать мнения экспертов, при этом результат будет уязвим для критики и упреков во вкусовщине. Естественно, возникает желание использовать для сравнения количественные критерии и методы, позволяющие делать однозначные и объективные выводы. Одними из первых в «промышленных масштабах» их стали применять компании-разработчики поисковых машин со второй половины 90-х годов. Разработанные ими алгоритмы основывались на нахождении страниц, релевантных поисковому запросу, и на последующем ранжировании полученного списка с учетом входящих ссылок. Пользователи заинтересованы в том, чтобы лучшие ссылки находились в верхней части выдачи, и этим потребностям вполен соответствовали поисковые системы Яндекс (1997) и Апорт (1996; в особенности версия 2000 г.). В США новый этап развития поисковых инструментов связан с появлением системы Google (1999) на основе алгоритма ранжирования сайтов PageRank. Детали PageRank и других подобных алгоритмов тщательно охраняются, однако в их основе всегда в той или иной форме присутствуют информационное наполнение и ссылочная популярность. В следующем разделе мы увидим, что для создателей мирового вебометрического рейтинга интерес представляют именно эти величины, а такие параметры как дизайн сайта, его «юзабилити» (эргономичность, дружественность к пользователю), популярность контента, выраженная числом посещений, в расчетах не участвуют и на результат не влияют.
Мировой рейтинг Webometrics
В ряду международных рейтингов особое место занимает Webometrics Ranking of World Universities [4], в котором оценка образовательных и научно-исследовательских достижений университетов мира выполняется на основе анализа представления вузов в интернет-пространстве, через сравнение их веб-сайтов. Рейтинг проводит с 2004 года исследовательская группа лаборатории киберметрии Высшего совета по научным исследованиям Министерства науки и инноваций Испании Laboratorio de Internet, изучающая образовательную и научную деятельность в интернете. Результаты публикуются дважды в год, в январе и июле.
В отличие от других известных рейтингов (британского, шанхайского, тайваньского и др.), уделяющих большое внимание характеристикам научной элиты, проект Webometrics направлен на измерение всех сторон деятельности университетов. Интерес вузов к этому рейтингу также обусловлен широким охватом университетов мира: в 2014 году в нем представлены более 22 тысяч вузов, это в десятки раз больше, чем в упомянутых рейтингах.
Ведущие позиции в мировых рейтингах стали де-факто свидетельством высокой конкурентоспособности вуза, проводимой в нем политики поощрения новых технологий и наличия ресурсов для их развития. Индикаторы рейтинга измеряют объём, наглядность и популярность веб-страниц университетского сайта. Особое внимание уделяется информации о научных исследованиях, содержащейся в онлайновых публикациях: монографиях, диссертациях, статьях, отчетах, докладах на конференциях. Веб-публикации значительно дешевле печатной продукции, имеют более широкую аудиторию, позволяют организовать неформальные научные связи ученых, работающих в одной области. Вебометрические рейтинги стимулируют коллективы научно-образовательных учреждений размещать информацию об исследованиях и передовых образовательных технологиях для свободного доступа в интернет-пространстве.
Руководитель испанской лаборатории и идеолог проекта Webometrics Исидро Агийо (Isidro F.Aguillo) убежден, что вебометрика при описании производительности академических и учебных организаций способна оценивать не только научные результаты, но и другие компоненты их деятельности: обучение, обнародование результатов, связь с индустрией и др. Анализируя лозунг «Публиковаться в сети или исчезнуть» (Web Publish or Perish), он отмечает, что в свете инициатив «открытого доступа» (Open Access) рост электронных публикаций – это не мода, а изменение парадигмы обмена научными результатами между учеными. Он также указывет на существенную корреляцию между Ranking Web of Universities и рейтингах, базирующихся на данных библиометрии или анкетирования (ARWU, Times Higher Education/QS). По его словам, вебометрические индикаторы полезны для обширного круга задач и существенно влияют на данные наукометрии .
До 2013 г. итоговый показатель рейтинга Webometrics определялся суммированием взвешенных значений четырех индикаторов:
S (Size) – количество страниц, фиксируемое Google, Yahoo, Live Search, Exalead (весовой коэффициент составлял 25% в 2004-2008 гг., 20% в 2009 г., 10% в 2012 г.);
V (Visibility) – число уникальных внешних ссылок от Yahoo (коэффициент 50%);
R (Rich files) – «насыщенные» (полнотекстовые, богатые) файлы, представленные в форматах Adobe Acrobat (.pdf), Adobe PostScript (.ps), Microsoft Word (.doc) и Microsoft Powerpoint (.ppt) (коэффициент: 12,5% в 2004-2008 гг., 15% в 2009 г., 10% в 2012 г.);
Sc (Scholar) – научные материалы (документы, доклады, публикации), содержащиеся в базе Google Scholar (коэффициент: 12,5% в 2004-2008 гг., 15% в 2009 г., 30% в 2012 г.).
В 2013-14 гг. методика неоднократно и существенно изменялась. Так, рейтинг Webometrics-2013 рассчитывался по двум показателям: Visibility (Видимость) и Activity (Деятельность), вес каждого из них 50%. Visibility сайта вычислялось как произведение квадратного корня из количества уникальных внешних ссылок на сайт и количества ссылающихся доменов. Источником данных служили два основных провайдера такой информации сервисы Majestic SEO и ahrefs . Чтобы исключить возможное искажение информации, в расчет не принимались 10 доменов, генерировавших наибольшее количество внешних ссылок.
Показатель Activity складывался из трех равноправных составляющих: Excellence (Научное превосходство), Presence (Присутствие) и Openness (Открытость). Два последних показателя фактически представляют собой S и R (см. выше), т.е. соответственно количество всех проиндексированных страниц университетского домена и количество «Rich files» на сайте вуза. В качестве измерительных средств использовались поисковые системы Google и Google Scholar (в июле 2013 г. при расчете рейтинга авторы отказались от Google Scholar и вернулись к общему количеству файлов без учета их «научности»). Показатель Excellence учитывает научные работы, опубликованные в престижных международных журналах; в расчет берутся только «excellent publications», то есть 10% наиболее цитируемых статей в соответствующих научных областях. Материалом служат данные исследовательской группы Scimago , которая выдает ненулевые значения для 5200 с лишним университетов за период, начиная с 2003 г. Таким образом, как и прежде, для рейтинга Webometrics важна как «научность» университета, к которой обеспечен публичный доступ, так и «востребованность» сайта вуза, что означает престижность сайта и авторитет цитируемого контента.
В 2014 году произошел частичный возврат к «хорошо забытому старому»; кроме того, из показателя Visibility выделен дополнительный показатель Altmetrics (альтметрика) – видимость в сетях профессионального общения и сотрудничества учёных (определяется по данным Academia, Facebook, LinkedIn, Mendeley, ResearchGate, Slideshare, Twitter, Wikipedia (все издания), Wikipedia (английское издание) и YouTube). Visibility и Altmetrics имеют весовые коэффициенты по 25%; остальные 50% распределяются между S (10%), R (10%) и Sс (30%). Заметим также, что в последней на данный момент версии количество «Rich files» исключается из S (общего числа страниц сайта). Кроме того, с июля 2014 г. при наличии у организации нескольких доменов учитываются показатели только одного из них – с максимальными значениями.
Россия в последней версии рейтинга Webometrics представлена 1113 организациями, однако ни одна из них не попала даже в первую сотню (МГУ имеет номер 122). Можно сетовать на то, что зарубежные поисковые системы неадекватно регистрируют кириллическую информацию, но надо признать очевидный факт: повышение качества интернет-ресурсов актуально для многих российских научных и образовательных учреждений. Анализ рейтингов веб-сайтов можно рассматривать как механизм, выявляющий слабые стороны и указывающий пути совершенствования информационной политики организации. Одновременно следует развивать и продвигать отечественные аналоги рейтинга Webometrics.
Отметим наряду с испанским рейтингом «международную поисковую систему и каталог по высшему образованию» 4 International Colleges & Universities , где на осень 2014 г. представлены 11307 колледжей и университетов (вдвое меньше, чем в Webometrics) из 200 стран мира, упорядоченных по их «сетевой популярности».
Развитие вебометрики в России и СНГ
В России вебометрические исследования проводятся с середины прошлого десятилетия. Среди пионеров этого направления следует назвать исследователей из Карельского научного центра РАН , изучавших вузы Северо-Запада России, а также университеты Финляндии. Сейчас они работают над проектом «Вебометрический рейтинг научных учреждений России» [5].
Институт вычислительных технологий Сибирского отделения РАН с 2008 года публикует рейтинг сайтов научных организаций СО РАН, который разрабатывается по инициативе директора института академика Ю.И. Шокина. За основу взят рейтинг Webometrics, но веса показателей считаются одинаковыми. Последний на данное время рейтинг от 26.09.2014 включает 91 организацию, первое место ожидаемо занимает портал Сибирского отделения РАН.
Сервис вебометрических исследований научных сайтов , созданный в Дальневосточном геологическом институте Дальневосточного отделения Российской академии наук (ДВГИ ДВО РАН) работает в интернете с начала июля 2012 г. Вебометрические исследования Сибирского федерального университета дальнейшего развития не получили, ссылки на момент подготовки этого текста не работают.
Занимаются вебометрикой и наши соседи. Специалисты из Киевского университета имени Б. Гринченко анализируют критерии и показатели вебометрического рейтинга университетов мира . Как еще один пример применения вебометрических методов на Украине можно указать «Методику розрахунку вебометричного рейтингу інститутів, факультетів та кафедр Сумського державного університету» . С 2005 г. рейтинговое агентство Белорусского госуниверситета совместно с информационно-аналитическим центром Минобразования на базе собственных показателей составляет рейтинг сайтов вузов республики . Оригинальная методика лежит и в основе упоминавшегося выше вебометрического рейтинга белорусских банков, который представляет все то же рейтинговое агентство БГУ (там три из пяти основных показателей определяются по оценкам экспертов). Специалисты из БГУ также анализируют присутствие вузов стран СНГ в мировом вебометрическом рейтинге, учитывая при этом профили их деятельности . А в Гродненском университете занимаются построением рейтингов веб-сайтов молокоперерабатывающих предприятий Гродненской области и республики в целом .
С учетом российского и международного опыта лаборатория вебометрики Института научной и педагогической информации РАО в 2012 г. начала формирование российского вебометрического индекса научных и образовательных учреждений [6,7]. Через год измерения повторились. Автор участвовал в этом проекте, предлагая алгоритмы обработки данных и выполняя вычисления. Редакция Индекса, выполненная в мае 2013 г. [8], охватывает официальные веб-сайты 1827 учреждений, подведомственных государственным академиям (по состоянию на тот момент РАН, РАО, РАМН, РАСХН), а также вузов, имеющих государственную аккредитацию. Результаты исследования опубликованы в [9].
В 2014 г. тот же коллектив выполнил еще один проект, связанный с вебометрикой. Государственная политика по повышению эффективности научной деятельности предусматривает, в частности, меры государственной поддержки программ развития научных журналов. Выбор нескольких десятков претендентов на поддержку среди тысяч журналов был поручен некоммерческому партнёрству «Национальный электронно-информационный консорциум» (НЭИКОН), которое разработало систему критериев, программное обеспечение, определило регламент работы, создало экспертный совет. В этот совет вошли и представители лаборатории вебометрики ИНИПИ, которые на основе собственной методики выполнили анализ сайтов отечественных научных журналов по спискам Российского индекса научного цитирования, Российской книжной палаты и международной наукометрической системы Scopus (всего порядка 2800 названий). Были выявлены лидеры по показателям «тематический индекс цитирования», «видимость сайта (visibility) по Google», «публикационная активность по Google Academia». По совокупности критериев лидирующие позиции заняли, в частности, сайты журналов «Полис. Политические исследования», «Вопросы экономики», «Открытые системы. СУБД», «Лечащий врач», «Успехи физических наук», «Высшее образование в России», «Вавиловский журнал генетики и селекции». Интересно, что результаты рейтинга сайтов неплохо коррелируют с рейтингом самих журналов.
О продвижении в рейтингах
Участники любого рейтинга, естественно, стремятся к улучшению своих позиций. Российские вузы имеют немалый потенциал для продвижения в проекте Webometrics. Упоминавшийся Исидро Агийо во время своего визита в Россию высказал ряд соображений на этот счет . Так, по его мнению, необходимо, чтобы вузы наладили обмен информацией между собой. Далее, вуз должен иметь единый домен для использования всеми вузовскими сайтами. Сейчас у некоторых университетов по три разных портала, что ухудшает их рейтинги и запутывает студентов и абитуриентов. Однако еще важнее создание значимого контента, что требует объединения усилий большого коллектива преподавателей, исследователей и студентов. Им предстоит изменить менталитет, отношение к публикации своих работ в открытом доступе. Авторы смогут публиковать свои материалы на собственных страницах, формировать библиотеки своих трудов, открытые для обсуждения коллегами.
Другие рекомендации относятся к многоязычности сайта (не менее 30% текстов должны быть переведены на английский язык); необходимости архивирования материалов (при изменении дизайна сайта важная информация может быть утрачена), связям с другими сайтами посредством гиперссылок. По возможности максимальное количество ресурсов вуза следует конвертировать в веб-страницы, сканируя при необходимости материалы, доступные в неэлектронном формате. Все это должно способствовать интеграции российских вузов в глобальное информационное пространство.
Сказанное означает, что корректируя свою веб-политику путем анализа позиций по каждому индикатору с учетом критериев рейтинга, практически любой вуз может заметно продвинуться в рейтинге Webometrics. Примером такого целенаправленного поведения может служить модификация сайта Владивостокского государственного университета экономики и сервиса (ВГУЭС). В вузе с 2012 г. проводится комплекс мероприятий, в частности:
• открыт публичный доступ к полнотекстовым научным публикациям сотрудников вуза, к текстам журналов, издающихся в университете, к материалам проводимых в университете конференций, к диссертациям, защищенным преподавателями университета;
• открыт публичный полнотекстовый доступ к учебно-методическим материалам университета. Во ВГУЭС издательство и преподаватели размещают такие материалы в хранилище полнотекстовых материалов, откуда они автоматически публикуются на сайте университета;
• на сайтах кафедр, институтов, главном сайте автоматически отображается информация об образовательных программах, учебных планах, графике учебного процесса, учебно-методической обеспеченности дисциплин;
• все полнотекстовые материалы выводятся на сайт университета в файлах форматов pdf, doc, docx, ppt, pptx, и имеют соответствующее расширение;
• в публичном доступе представлены видеолекции, записанные в университете;
• увеличено количество страниц сайта университета, содержащих уникальный контент за счет создания сайтов и страниц проектов, а также за счет использования объектной модели системы управления контентом, позволяющей отображать один и тот же объект на разных страницах, в разном представлении [10].
В результате такой модификации сайт поднялся по версии Webometrics в мировом рейтинге университетов за полгода на 1214 пунктов (с 3238-го места на 2024-е), а среди российских вузов на 56 пунктов (с 98-го на 42-е). В Российском индексе веб-сайтов научно-образовательных учреждений ВГУЭС в 2013 г. занял 28-ю позицию (в 2012 г. – 71).
Однако на следующий год испанцы изменили методику расчета показателей, и рейтинг ВГУЭС снизился на 663 пункта, несмотря на значительное увеличение количества страниц на сайте (прирост их числа составил 19000) и некоторое улучшение позиций по показателям «Видимость» и «Научное превосходство». Сотрудники оперативно отреагировали на новшество и разработали очередной план мероприятий, включающий перевод информационных текстов из основных разделов сайта на английский и китайский языки, повышение публикационной активности научно-педагогических работников университета, публикацию на сайте нормативно-справочных материалов вуза в присоединенных файлах и др. Принятые меры возымели некоторый эффект, однако система критериев изменилась вновь. Результат: в июльской (2014) версии Webometrics ВГУЭС занимает 2565-е место в мировом рейтинге; среди российских вузов он 46-й.
О качестве рейтингов и инструментария
Совершенных рейтингов не существует. Профессионалы активно критикуют методологии рейтингования за недостаточную обоснованность применяемых критериев, несовершенство способов обработки статистических данных. Много вопросов вызывает и качество исходной информации. Объективные числовые показатели порой соседствуют с неформализованным мнением экспертов с различным уровнем компетентности и со своими вкусами и интересами. Вряд ли продуктивно сравнивать университеты, различные по своей миссии, целям, задачам, истории, направленности, достижениям, на основании одних лишь экспертных оценок. С другой стороны, количественные критерии, дающие высокие места в рейтингах, характеризуют лишь отдельные аспекты деятельности учебного заведения. Они не позволяют объективно определить, какой вуз лучше – тот, где когда-то учился будущий нобелевский лауреат (это один из важных показателей рейтинга ARWU) или другой, постоянно выпускающий отличных математиков (или технологов, или врачей). Число нобелиатов в штате скорее характеризует способность университета привлекать на работу ведущих исследователей, чем качество научно-исследовательской деятельности.
Формой протеста против действующих рейтингов является разработка собственных университетских рейтингов. Примером может служить появившийся в 2007 г. французский рейтинг Professional Ranking of World Universities, разработанный Ecole Nationale Superieure des Mines de Paris. Не первый год носится с идеей собственного мирового рейтинга вузов со штаб-квартирой в Москве ректор МГУ ; о том же говорил министр обороны на заседании правительства . Другой способ реагирования (точнее, отсутствия реагирования) на рейтинги – это их бойкотирование, к которому порой прибегают достаточно сильные и успешные университеты. С 2012 г. Гамбургский университет бойкотирует подобные рейтинги. Аргументы: они необъективны; их подготовка отвлекает от основных занятий и требует дополнительных расходов, а в итоге рейтинги не отражают реального положения и искажают представление об университете как у абитуриентов, так и у властей .
Вебометрические рейтинги также не свободны от дефектов. Их хорошо знают и сами создатели рейтингов; об этом свидетельствуют, в частности, отмеченные выше неоднократные изменения методики расчета Webometrics (другим мотивом таких коррекций, вероятно, является желание авторов отразить попытки вузов приспособиться к методике и улучшить свои показатели).
Но не все ошибки Webometrics оперативно исправляются самими авторами рейтинга. Так, в выпуске от января 2012 года некорректно рассчитаны показатели Высшей школы экономики и ряда российских технических вузов, что заметно исказило их позиции . Сотрудники Карельского научного центра РАН (КарНЦ РАН) выражают сомнения в применимости коммерческих поисковых машин для измерения вебометрических индикаторов . Они приводят следующий пример: при измерении общего количества страниц сайта КарНЦ www.krc.karelia.ru поисковая машина Яндекс дает результат 30 000, Google 5670, а Yahoo – 18. При этом, как достоверно известно владельцам сайта, реальное количество страниц чуть меньше 17 000. Алгоритмы работы поисковых роботов и механизмы индексации страниц являются коммерческой тайной и держатся в секрете, поэтому невозможно понять, почему, к примеру, Google индексирует лишь треть истинного числа страниц, а Yahoo – только тысячную часть.
Как и карельские коллеги, мы при разработке и тестировании Индекса столкнулись с тем, что западные поисковые системы не всегда корректно работают с российскими сайтами. Так, в поисковой системе Google оказывается невозможен поиск по организациям, имеющим кириллические домены .рф: система рассматривает имя домена как обычное ключевое слово, и результаты поиска некорректны. Значения, получаемые в системах Яндекс и Google, порой различаются на порядок. Для улучшения достоверности результатов отечественные исследователи, как правило, используют и Яндекс, и Google.
Отмечались и другие проблемы, требующие анализа и обсуждения. Они касаются субъектов изменения, выбора инструментария, методики измерения показателей, а также их ранжирования и формирования сводного индекса.
• В качестве единиц анализа берутся доменные имена официальных сайтов организаций. Однако многие организации создают и поддерживают весьма значимые и информативные веб-ресурсы, имена которых не имеют ничего общего с титульным сайтом. Например, в ВЦ МГУ помимо основного сайта srcc.msu.su поддерживается огромная информационная система «Россия» www.cir.ru, ресурс по параллельным вычислениям parallel.ru и др.; в ИПУ РАН наряду с www.ipu.ru существует крупный сайт «Теория управления организационными системами» (доменное имя www.mtas.ru), который не воспринимается поисковыми системами как веб-ресурс института.
• Свертка частных показателей в интегральный может выполняться по различным формулам. Мы видели, что у испанских коллег весовые коэффициенты периодически меняются с целью усилить роль размещенных на сайте полнотекстовых файлов и статей, а также их цитирования в интернете. Известны и другие подходы к построению критерия ранжирования. В ряде случаев помимо абсолютных значений показателей для каждой организации определяются ранги, то есть по каждому критерию находится порядковый номер организации с первой по последнюю. Так, в ИВТ СО РАН рейтинги сайтов всех институтов вычисляются простым суммированием этих рангов, и более высокие места в глобальном рейтинге занимают организации с минимальным значением суммы рангов. Сходный метод использовался и нами при составлении российского индекса, поскольку это позволяет нормировать слишком большой разброс исходных показателей.
• Непрозрачность алгоритмов, используемых поисковыми системами, затрудняет планирование мероприятий, направленных на повышение качества веб-ресурса и его продвижение в рейтинге.
• Многие сайты отечественных научно-образовательных учреждений нуждаются в серьезной доработке. Значительная доля сайтов неинформативна, что приводит к низким значениям всех вебометрических показателей. Некоторые учреждения ограничиваются страницами на общих сайтах. Для таких случаев корректный подсчет показателей невозможен. Наконец, почти 150 организаций, т.е. около 8%, вообще не имеют сайтов (в основном это учреждения РАСХН, негосударственные вузы или военные учебные заведения).
Несмотря на указанные обстоятельства, вебометрические рейтинги – как мировой, так и национальные – предоставляют большой объем сопоставительной информации и объективно способствуют улучшению качества веб-сайтов, влияют на государственную политику в сфере науки и образования и на финансирование; перспективы академического сотрудничества с другими университетами страны и мира; выбор абитуриентов и качество студентов. При этом необходима постоянная работа по совершенствованию самих рейтингов.
Литература:
1. Tomas C. Almind and Peter Ingwersen. Informetric analyses on the World Wide Web: Methodological approaches to «webometrics» // Journal of Documentation 53 (4): 404–426.
2. Парахина О.В., Поляк Ю.Е. Гражданское общество и доступность информации // Информационные ресурсы России. - 2005. - № 2. – С. 14-16
3. Поляк Ю.Е. Электронная демократия, вид сверху // Информационные ресурсы России. - 2011. - № 5. – С. 5-10.
4. Webometrics Ranking of World Universities [Электронный ресурс]. URL: http://webometrics.info (дата обращения: 17.10.2014).
5. Печников А.А. О проекте «Вебометрический рейтинг научных учреждений России» // Информационная среда вуза XXI века: материалы VII международной научно-практической конференции. - Петрозаводск, 2013.
6. Антопольский А.Б., Поляк Ю.Е., Усанов В.Е. О российском индексе веб-сайтов научно-образовательных учреждений // Информационные ресурсы России. - 2012. - № 4. – С. 2-7.
7. Поляк Ю.Е. О новой методике оценки веб-сайтов научно-образовательных учреждений // Россия: тенденции и перспективы развития. Ежегодник. Вып. 8. / РАН. ИНИОН. Отд. науч. сотрудничества и междунар. связей; Отв. ред. Ю.С. Пивоваров. М., 2013. Ч. 2.
8. Антопольский А.Б., Поляк Ю.Е., Усанов В.Е. Развитие вебометрического индекса научно-образовательных учреждений России // Информационные ресурсы России. -2013. - № 4. – С. 16-24.
9. Антопольский А.Б., Поляк Ю.Е. Новый вебометрический индекс научно-образовательных учреждений России // Инновации на основе информационных и коммуникационных технологий: Материалы международной научно-практической конференции. М.: МИЭМ НИУ ВШЭ, 2013.
10. Шахгельдян К.И., Трофимчук И.А. Подход к повышению позиции университета в рейтинге Webometrics // XX Всероссийская научно-методическая конференция «Телематика'2013». СПб, 2013.