«Информационные Ресурсы России» №4, 2012



Л. Бершадская, А. Биккулов, Е. Болгова, А. Чугунов, А. Якушев.

Социальные сети и социометрические исследования: теоретические основания и практика использования автоматизированного инструментария изучения виртуальных сообществ

Введение

Развитие информационных технологий стимулирует появление новых методов и направлений исследований в различных предметных областях. В частности, бурный рост числа пользователей социальных сетей в интернете обеспечивает информационную базу, позволяющую на качественно новом уровне обеспечить исследования в области социодинамики – междисциплинарного научного направления, базирующегося на сочетании математических методов с концепциями социальных наук, на основе которого разрабатывается системный подход к моделированию широкого класса коллективных социальных процессов в различных секторах общества [1, с. 19].

В настоящее время весьма актуальной задачей является разработка автоматизированного исследовательского инструментария, позволяющего проводить социометрические исследования в социальных сетях. На решение данных задач ориентирован проект, реализуемый в Санкт-Петербургском национальном исследовательском университете информационных технологий, механики и оптики (НИУ ИТМО), в рамках которого создан веб-ориентированный производственно-исследовательский центр для решения прикладных задач в области социодинамики [2].

Настоящая статья посвящена теме развития исследований виртуальных сообществ в интернете и представляет результаты работ, выполненных в рамках ряда проектов.

Коллектив исполнителей проекта заинтересован в профессиональном обсуждении этой проблематики, проведении исследований по актуальным социальным проблемам, а также в сотрудничестве по использованию инструментария производственно-исследовательского центра «Социодинамика», созданного в НИУ ИТМО.

1. Развитие методов исследований виртуальных сообществ в интернете

Современные подходы к изучению социальных сетей сформировались под влиянием длительного развития социологии, социальной информатики, теории множеств, статистики, математической лингвистики и др.
Считается, что в научный оборот термин «социальная сеть» был введен в 1954 году социологом Д. Барнсом в работе «Классы и собрания в норвежском островном приходе», вышедшей в сборнике «Человеческие отношения». Д. Барнс развил подход Дж. Морено к исследованию взаимосвязей между людьми с помощью социограмм, то есть визуальных диаграмм, в которых отдельные лица представлены в виде точек, а связи между ними — в виде линий. Не случайно, что пионерами в развитии методологии современного сетевого анализа стали антропологи, которым было важно зафиксировать различия в структурах небольших и традиционных обществ и выработать методы их эмпирического исследования [3]. А. Радклифф-Браун [4] первым использовал терминологию сетевых исследований и призвал рассматривать общественную структуру как сеть социальных отношений. Впоследствии основные направления исследования сетевых сообществ были заложены в методологическом аппарате П. Лазарсфельда, Дж. Морено, Дж. Хоманса, Ф. Хейзера, А. Бейвласа, Дж. Коулмена, С. Найдела, С. Милграма, М. Грановеттера.

Необходимо определить понятие «Виртуальное сообщество». Максимально широкое определение дает Е.Д. Патаракин, который под виртуальными сообществами понимает социальные объединения, сложившиеся в интернете, в которых сформирована сеть личных 5отношений в киберпространстве на основе открытого взаимодействия [5, с. 8]. На наш взгляд, целесообразно за основу взять определение, предложенное в монографии С.В. Бондаренко: «Под дефиницией «виртуальное сетевое сообщество» понимается базовая единица социальной организации пользователей телекоммуникационных сетей, имеющая стратификационную систему, устоявшиеся социальные нормы, роли и статусы участников, включающая в свой состав не менее трех акторов, разделяющих общие ценности и осуществляющих посредством использования соответствующих аппаратных и программных артефактов на регулярной основе социальные взаимодействия, а также имеющих доступ к контенту и иным общим ресурсам» [6, с. 68-69].
В рамках исследований сетевых сообществ, с одной стороны, применяются традиционные социологические методы, основанные на формировании выборки и выборочном исследовании. С другой стороны, развитие прикладного программного обеспечения и средств компьютерного анализа текстовой информации привело к созданию новых инструментов исследований, основанных на автоматизированном анализе текстов киберпространства. Также все чаще отдельные части традиционных исследований автоматизируются и получаются смешанные методы, включающие как традиционные подходы, так и элементы автоматизированного сбора и/или обработки информации (рис. 1).

Не указано

 Рис. 1. Методы исследования виртуальных сообществ

Многообразие существующего инструментария позволяет выделить методы, наиболее часто используемые в исследовательских практиках.

Методы и инструменты анализа социальных сетей
(далее – АСС) и метод динамического анализа социальных сетей. В своих работах инструментарий АСС используют С. Торал, М. Матинер-Торрес и Ф. Барреро [7]. На основе математических инструментов, применяемых в АСС, Ф. Санчес разрабатывал модели конкурентных сообществ в виртуальной среде [8]. В соответствии с этой методологией Р. ван дер Мерве, Л. Питт и П. Бертон разработали классификацию факторов в социальных сетях, разделив их на 4 категории: известные, центральные, престижные и сплоченные подгруппы [9].

Метод динамического анализа социальных сетей применяется коллективом исследователей (Т. Иба, К. Немото, Б. Петерс, П. Глоор) [10], создавших инструмент преобразования потоков авторской информации в социальной сети с целью определения самых креативных авторов, которые делают наибольшее количество записей в англоязычной Википедии. Дж. Кларк и Н. Темудо применяют методологию исследований социальных движений на примере сетей в интернете, в частности, движения антиглобалистов и создания политических сетей для поддержки социальных движений [11].

Социометрия – это методы измерения межличностных отношений, автором которых является американский психиатр и социальный психолог Якоб Морено. Построение социограммы – схемы связей участников сообщества – широко применяется при анализе разнородной информации в социальных сетях при попытке выявления подгрупп интересов между пользователями.

Методы формального анализа социометрических моделей
ориентированы на использование различных процедур из области статистического анализа, обработки данных и извлечения знаний из неструктурированной информации.

Выборочный метод представляет собой применение классического социологического инструментария для определения границ выборочной совокупности. К примеру, С. Хиндуйа и Дж. Патчин в исследовании личных профилей подростков в сети My Space [12] отбирали единицы анализа с помощью генератора случайных чисел.

Средства Data Mining – это совокупность методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечеткой логики. Возможности применения данных методов в сфере анализа виртуальных взаимодействий описаны в работе Д. Хэнда [13].

Метод контент-анализа
– это качественно-количественный метод анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Для проведения контент-анализа данные собираются некоторыми исследователями вручную  или  автоматизированным способом. Например, применяя контент-анализ, С. Хиндуйа и Дж. Патчин, например, провели количественный анализ контента профилей подростков на предмет заполнения разделов личной информации [12].

Социально-антропологические методы
качественного анализа информации позволяют анализировать единичные поведенческие акты, а в ситуации исследования виртуальных сообществ – и примеры отдельных коммуникативных практик. Среди российских исследований применение этого метода можно найти в работах В.В. Зайонца [14].

На современном этапе преобладающее большинство проведенных исследований посвящено проблемам формирования сообществ в интернете, построения их структуры, выявления кластеров. Кроме того, широко распространены исследования конкретных предметных сообществ.

Таким образом, проведенный анализ демонстрирует разнообразие решаемых предметных задач в области социодинамики с использованием ограниченного набора методов и технологий. Основные различия возникают в области приложений и интерпретации результатов, полученных по достаточно устоявшимся процедурам.

Исследовательский коллектив НИУ ИТМО поставил задачу охвата рассматриваемой проблемы в рамках предметно-ориентированного научно-исследовательского центра с ориентацией на широкую целевую группу потенциальных пользователей - представителей гуманитарных дисциплин и междисциплинарных научных направлений.

2. Концепция центра «Социодинамика» и его возможности

В НИУ ИТМО с 2011 года реализуется проект «Разработка web-ориентированного производственно-исследовательского центра в области социодинамики и ее приложений».

Разработанный в рамках проекта веб-центр представляет собой платформу облачных вычислений, позволяющую проводить исследования различных процессов в социальных сетях, объединять исследовательские коллективы, обеспечивать доступ к учебным материалам в области анализа и моделирования процессов в социальных сетях.

Центр «Социодинамика» содержит широкий набор сервисов для пользователей:
Сервисы сбора данных в социальных сетях реализуют различные модели краулинга (обход в глубину, в ширину) с оценкой общности по различным факторам, включая семантический профиль узлов сети. В качестве основного объекта для извлечения данных в рамках данного проекта выбрана социальная сеть LiveJournal (Живой журнал, ЖЖ). Русский сегмент ЖЖ насчитывает чуть более 2 млн. блогов. Серьезным аргументом в пользу использования данной социальной сети в качестве объекта компьютеризированных социометрических исследований является открытость этой сети для автоматизированного сбора данных.

Сервисы статистической обработки
и анализа данных используют  общий подход к описанию многомерных комплексных сетей – стохастических графов с многомерными характеристиками вершин.

Сервисы моделирования сценариев включают в себя различные вероятностные модели социодинамики в терминах микро- и (или) макропараметров социальных сетей.

Сервисы визуализации
ориентируются на применение моделей анализа и представления комплексных сетей, рассмотренных выше.

Помимо отдельных сервисов веб-центр предоставляет возможности выполнения преднастроенных демонстрационных исследовательских сценариев:
•    построение социограммы неформального сообщества, анализ скорости и каналов распространения информации;
•    анализ и прогноз индексов общественных настроений;
•    выявление групп влияний в социальной сети и определение «лидеров мнений»;
•    выявление призывов к офлайн общественным/экстремистским акциям;
•    обнаружение источников умышленной дезинформации.

3. Проведение исследований процессов в социальных сетях на основе возможностей центра «Социодинамика»

Для демонстрации возможностей работы центра «Социодинамика» был реализован следующий исследовательский сценарий:
•    построение социограммы неформального сообщества, анализ скорости и каналов распространения информации;
•    анализ и прогноз индексов общественных настроений, мониторинг манипуляций мнениями.

В рамках выполнения данного тематического сценария были поставлены  следующие исследовательские задачи:
•    выяснить, являются ли пользователи, интересующиеся и обсуждающие определенную тематику, преимущественно разрозненными одиночками либо они активно самоорганизуются в неформальные сообщества;
•    исследовать, насколько разрозненны или плотны такого рода неформальные сообщества;
•    рассчитать, каково среднее число связей между членами сообщества;
•    выявить каналы и скорость распространения разного рода информации среди пользователей LiveJournal;
•    выявить наиболее активных распространителей сообщений в неформальном сообществе.

Для выполнения исследовательского сценария была использована цепочка заданий из нескольких этапов:
•    извлечение информации о сети неформального сообщества пользователей LiveJournal с помощью пакета краулинга на основе поиска по заданному набору ключевых слов;
•    расчет основных показателей сети неформального сообщества (плотность сети, смежность и т.д.);
•    построение социограммы неформального сообщества;
•    анализ статистических параметров скорости распространения информации;
•    анализ статистических параметров изменения числового значения индекса общественных настроений касательно обсуждений законов о пропаганде гомосексуализма и педофилии (суммарной частоты упоминания в записях пользователей LiveJournal ключевых слов/словосочетаний по определенной тематике)  во времени.

Для реализации сценариев использовались данные по теме «Законы о пропаганде гомосексуализма и педофилии», принятие которых в регионах России вызвало волну обсуждений, в основном со стороны  правозащитников и собственно представителей сексуальных меньшинств, так как, с одной стороны, эти законы практически бесполезны, так как любая сексуальная пропаганда несовершеннолетним (на защиту которых, в основном, направлены законы) и так запрещена законами. С другой стороны, этот закон фактически запрещает проведение гей-парадов и общественных гей-акций, что противоречит международно-принятому законодательству, в результате чего Европейский суд по правам человека в Страсбурге уже присудил Правительству РФ выплатить штраф в размере 50 тысяч евро за незаконное ограничение прав сексуальных меньшинств по факту отказов в проведении гей-парадов и общественных гей-акций [15]. Кроме того, данная выборка пользователей может рассматриваться и как сообщество, и как сеть коммуникационного процесса по передаче информации.

На основе ключевых слов по заданной тематике выполнялся краулинг социальной сети «Живой журнал» (ЖЖ), были сформированы сети и совокупности сообщений пользователей, содержащие упомянутые ключевые слова. Сеть составлялась на основе всех найденных сообщений с ключевыми словами и связей подписки между пользователями. Тем не менее, для визуализации и анализа выбирались только актуализированные в данной тематике пользователи сети, относительно недавно писавшие что-то на заданную тему (анализировалось содержание последних 25 записей пользователя).

В состав Центра встроены несколько программных пакетов для анализа сетей и визуализации. На рис. 2 представлен результат построения визуализированной социограммы сообщества обсуждения темы, визуализированной с помощью программного пакета JUNG.
 
Не указано

Рис. 2. Социограмма неформального сообщества пользователей ЖЖ, обсуждающих тематику «Законы о пропаганде гомосексуализма и педофилии» (получено с использованием пакета JUNG)

На рис. 3. продемонстрирован альтернативный результат построения социограммы того же сообщества с помощью программного пакета Prefuse, которая при данном способе построения является одновременно и социограммой, и схемой каналов распространения информации, так как на рисунке представлен ориентированный граф, построенный с учетом не только связей подписки (дружбы) пользователей, но и даты и времени сообщений, связанных с тематикой законов о пропаганде гомосексуализма.
 
Не указано

Рис. 3. Социограмма неформального сообщества, а также каналов распространения информации среди пользователей ЖЖ, обсуждающих тематику «Законы о пропаганде гомосексуализма и педофилии» (получено с использованием пакета Prefuse)

В ходе анализа полученного неформального сообщества пользователей, интересующихся тематикой «Законы о пропаганде гомосексуализма», были получены следующие результаты:
1) В сообществе относительно мало одиночек. Одиночные кружки/точки обозначают пользователей, не связанных подпиской с другими членами сообщества. На рис. 2 эти пользователи распределены по внешнему диаметру социограммы, на рис. 3 такого рода пользователи распределены по свободному пространству социограммы.
2) Явно проявляются процессы сетевой самоорганизации, охватывающие достаточно большое количество членов этого неформального сообщества. Эти выводы подтверждают и данные расчетов основных параметров для этой самоорганизованной неформальной сети. Средняя степень вершины составляет 5.6, показатель смежности – 7.0. Эти параметры показывают относительно высокую сплоченность рассматриваемой неформальной группы.
3) Исследование позволило выделить наиболее влиятельных членов сообщества, лидеров мнений – по количеству сообщений, которые были «подхвачены» подписанными на этих лидеров мнений членов сообщества (представлены на рис. 2 шарами большого размера – диаметр шара пропорционален количеству сообщений «подхваченных» другими членами сообщества).
4) С помощью программных средств web-центра были рассчитаны характеристики частоты появления сообщений по тематике «Законы о пропаганде гомосексуализма». Результаты этих расчетов представлены на рис. 4.
 
Не указано

Рис. 4. Динамика количества сообщений в «Живом журнале» с ключевыми словами, связанными с законами «О пропаганде гомосексуализма»
с 21 апреля по 20 июня 2012 г.

Можно заметить, что на фоне достаточно стабильного уровня обсуждения данной тематики (в пределах нескольких сообщений в день) прослеживается явная взаимосвязь всплесков активности обсуждения данной тематики с внешними информационными поводами (которые обычно предшествуют на один день или идут вровень со всплесками публикационной активности). Основные всплески активности обозначены на рисунке буквами «В» с порядковым номером. Итак, отмеченные пики публикационной активности в «Живом журнале» (ЖЖ), вероятно, связаны со следующими событиями:
(В1) 22.04.2012. У стен храма Христа Спасителя (Москва) состоялось молитвенное стояние «В защиту веры и святынь», на котором выдвигались, в том числе, и лозунги противодействия гомосексуализму. В молебне приняло участие, по данным ГУВД  Москвы,  более 65 тысяч человек, в этот же день по всей России отслужены подобные стояния. 23.04.2012. Интерфакс опубликовал новость «Мосгордума хочет запретить пропаганду любых сексуальных отношений среди несовершеннолетних». 24.04.2012. В Живом журнале появляется статья «Детский порно-гей-фестиваль» с видероликами и фотографиями, которая многократно перепечатывается другими блогерами в течение последующих дней. 25.04.2012. В СМИ («Новая газета», Русская служба ВВС) размещена новость «Почти две недели школьника, признавшегося в гомосексуальной ориентации, продержали в наркологической клинике». Сообщения об освобождении школьника и деталях этой истории были многократно перепечатаны и обсуждены пользователями ЖЖ.

(В2) 01.05.2012. В СМИ размещена новость о задержании активистов гей-движения во время их первомайского шествия в Санкт-Петербурге. Были задержаны 15 геев и лесбиянок, поднявших радужные флаги. 02.05.2012. knedlik79 – активный блогер ЛГБТ-сообщества (ЛГБТ – общепринятое сокращение для сообщества Лесбиянок, Геев, Бисексуалов и Трансгендеров), опубликовала в сообществе feministki призыв подписать петицию об отклонении рассмотрения гомофобных законопроектов на Украине. Ее призыв был многократно ретранслирован другими пользователями ЖЖ. 04.05.2012. В Петербурге суд вынес первое решение по городскому закону о пропаганде гомосексуализма.

(В3) 10.05.2012. Петербургский суд обнародовал полный текст вердикта по гей-пропаганде, признав гомосексуализм извращением.

(В4) 23.05.2012, 24.05.2012. Пресс-релизы события активно публиковались в СМИ 23.05.2012, а 24.05.2012 состоялось рассмотрение принятого петербургского закона «О пропаганде гомосексуализма» на соответствие федеральному законодательству. Санкт-Петербургский суд признал закон «О пропаганде гомосексуализма» соответствующим федеральному законодательству.

(В5) 27.05.2012. Полиция задержала около 40 человек в ходе разгона несанкционированных пикетов гей-движения у зданий Мосгордумы и мэрии Москвы.

(В6) 07.06.2012. Депутаты Законодательного собрания Новосибирской области окончательно утвердили систему штрафов за «пропаганду гомосексуализма и педофилии несовершеннолетним». 07.06.2012. Вышла статья Санкт-Петербургской ЛГБТ-организации «Выход»: «Городской суд: безграмотная гомофобная поправка соответствует федеральному законодательству».

(В7) 11.06.2012 – В интернете организован сбор подписей В.В. Путину с просьбой обратить внимание на проблемы пропаганды гомосексуализма и нетрадиционных сексуальных отношений.

(В8) 13.06.2012. Петербургский закон о пропаганде гомосексуализма обжалован в Страсбургском суде. Этому предшествовали пресс-релизы в СМИ. 19.06.2012. Виталий Милонов (автор законопроекта «О пропаганде гомосексуализма и педофилии»)  завоевал антипремию «Серебряная калоша» в номинации «Эгегей, гея бей», врученную ему «за предложение отменить гомосексуализм до 2015 года».

Таким образом, совокупные результаты данного экспериментального исследования  позволили сделать вывод о применимости функциональных возможностей веб-ориентированного производственно-исследовательского центра в области  социодинамики  и ее приложений для решения прикладных задач в области социодинамики и ее приложений.

Описанный сценарий является типовым примером, доступным для повторения (на разных тематических выборках) другими пользователями веб-центра. Помимо этого пользователям предоставлена возможность самостоятельного составления сценариев, комбинирования этапов их выполнения, что является существенным вкладом в инструментальный аппарат изучения процессов в социальных сетях.

Заключение и выводы

В заключение хочется отметить, что появление автоматизированных инструментов исследования и анализа виртуальных сообществ на основе платформ облачных вычислений, пример которых представлен web-ориентированным производственно-исследовательским центром в области социодинамики и ее приложений, разработанным в НИУ ИТМО, значительно расширяет исследовательские возможности российских ученых в сфере гуманитарных наук: социологов, психологов и др. Эти возможности позволяют на новом уровне применять активно развивающийся сегодня сетевой подход к исследованию неформальных сообществ, получая интересные и наглядные результаты, не требуя при этом от исследователя глубоких знаний в программировании или знания иностранных языков для применения англоязычных программных пакетов (составляющих подавляющее большинство современных программных инструментов).

Разработанные в рамках веб-центра учебно-методические материалы позволяют эффективно и с хорошей опорой на практические примеры обучать студентов гуманитарных направлений применению сетевого подхода к анализу виртуальных сообществ и процессов, происходящих в них, что позволяет надеяться на все более широкое применение сетевого подхода и тематики анализа социальных сетей в практике российских гуманитарных исследований.

Литература:
1.    Вайдлих В. Социодинамика: системный подход к математическому моделированию в социальных науках. - М.: Либроком, 2010. – 288 с.
2.    Иванов С.В. Web-ориентированный производственно-исследовательский центр „Социодинамика“ / Иванов С.В., Болгова Е.В., Каширин В.В., Якушев А.В., Чугунов А.В., Бухановский А.В. // Приборостроение. - 2011. - № 10.  - С. 65-72.
3.    Назарчук А.В. О сетевых исследованиях в социальных науках // Социологические исследования. - 2011. - №1. - С. 39-51.
4.    Radcliffe-Brown A.R. Structure and Function in Primitive Society: Essays and Addresses. L.: Cohen & West, 1952.
5.    Патаракин Е.Д. Сетевые сообщества и обучение.  – М.:ПЕР СЭ, 2006. - 112 с. 
6.    Бондаренко С.В. Социальная структура виртуальных сетевых сообществ. - Ростов-на-Дону: Издательство Рост. гос. ун-та, 2004. – 319 с.
7.    Toral S.L., Matiner-Torres M.R., Barrero F. Modelling Mailing List Behavior in Open Source Projects: the Case of ARM Embedded Linux // Journal of Universal Computer Science. - 2009. - Vol. 15. - № 3. - P. 648-664.
8.    Sanches F. P. Competitively Groups on Social Network Sites // Mathematical and Computer Modeling. - 2010. - Vol. 52. - N 7-8. - P. 1052-1057.
9.    Merwe R. van der, Pitt L, Berthon P. The strategic Elusive Ensembles // European Management Journal. - 2004. - Vol. 22. - No 1. - P. 12-26.
10.    Iba T., Nemoto K., Peters B., Gloor P.A. Analyzing the Creative Editing Behavior of Wikipedia Editors Through Dynamic Social Network Analysis // Procedia Social and Behavioral Sciences. - 2010. - N 2. - P. 6441–6456.
11.    Clark J. D., Themudo N. Linking the Web and the Street: Internet-based “Dotcauses” and Anti-Globalization Movement // World Development. - 2006. - Vol. 34. - N.1. - P. 50-74.
12.    Hinduja S., Patchin J.W. Personal information of adolescents on the Internet: A quantitative content analysis of My Space // Journal of Adolescence. - 2008. - Vol. 31. - N. 1. - P. 125-146.
13.    Hand D.J. Information Generation: How data rule our world. OneWorld Publications, 2007.
14.    Зайонц В.В. Социально-антропологический подход к исследованию интернет-сообществ // Журнал социологии и социальной антропологии. - 2011. - Т. XIV. - С. 200 205.
15.    Петербургский закон о пропаганде гомосексуализма обжалован в Страсбургском суде// Деловой Петербург.  - 13.06.2012. - URL: http://www.dp.ru/a/2012/06/13/Peterburgskij_zakon_o_pro/ (дата обращения 20.07.2012).