"Библиотека своими руками. "Нам нужна инфраструктура открытого доступа"
Как создать ресурс с месячной аудиторией в 3 миллиона человек, почему Голландия демонстрирует лучшие кейсы в сфере открытого доступа и где в интернете искать научную информацию – в интервью с Дмитрием Семячкиным и Михаилом Сергеевым, создателями научной электронной библиотеки «КиберЛенинка».
— Как появилась идея создать «КиберЛенинку»?
Дмитрий Семячкин: Когда я занимался наукой, у меня была проблема с доступом к научным публикациям, которые мне были необходимы. Тогда я подумал, что было бы неплохо эту проблему решить. Потом нашлись единомышленники, и мы решили попробовать запустить проект.
Осенью 2012 года появилась первая версия «КиберЛенинки». Сайт содержал, если мне не изменяет память, 40 изданий и порядка 20 тысяч статей. Это был старт, и, как и на любом старте, было тяжело. Сейчас сложно сказать, как мы набрали издательства, с которыми теперь работаем. Мы сразу решили, что работаем легально, поэтому с каждым издательством нужно заключать лицензионный договор на контент. Сейчас у нас 1150 журналов и более 1 млн статей.
— Сколько человек у Вас работает?
Д.С.: Нас всего лишь шестеро. Это всегда вызывает удивление.
— Как выкладывается контент? Вы сами его готовите?
Д.С.: Мы пробовали разные способы, например, просили издательства выкладывать контент самостоятельно. Потом стало понятно, что они не готовы это делать, это лишняя работа, и если мы будем рассчитывать на них, то у нас вообще ничего не будет. Поэтому контент мы готовим сами.
У нас есть некоторые инструменты, которые позволяют упростить эту работу, повысить эффективность, сократить время. Сейчас, конечно, уже понятно, что проект растёт, и журналов будет всё больше и больше. Каждый журнал, который мы взяли, мы тащим сами, потому что каждый месяц, каждый квартал выходит новый номер, и мы должны его разместить. И с каждым новым изданием работы становится все больше.
— Кто Ваша аудитория?
Д.С.: Материалы нашего сайта читают самые разные пользователи. Костяк аудитории – это школьники и студенты, которые пишут рефераты, курсовые и дипломы. До этого они пользовались базами рефератов, но те, как правило, предоставляют низкокачественный контент. К тому же, оттуда можно вытащить совсем небольшие объемы информации. Сейчас ребята фактически пользуются первоисточниками.
По сути, нас, как и Википедию, читают обычные пользователи. Они что-то ищут, им нужна справочная информация. Например, в школе проходят Толстого. Как вы думаете, что у нас происходит? Люди приходят на сайт и начинают читать материалы про Толстого. Или, к примеру, на Первом канале шел сериал про Чкалова, в это время многие приходили к нам, читали, кто же это такой. Это были никакие не ученые и не школьники, обычные пользователи, которые заинтересовались исторической фигурой. Так что по запросам на нашем сайте можно отслеживать, что интересует общество в данный момент.
— Вашим ресурсом пользуются и журналисты. Например, я читаю статьи с «КиберЛенинки», правда, даже у Вас не всегда могу найти материалы по интересующим меня темам.
Д.С.: Что пишут, как говорится. Мы не можем претендовать на полноту. На нашем ресурсе находится примерно половина изданий, которые есть в России. Когда появится вторая половина – тогда, возможно появится и то, что вас интересует.
— Тяжело заставить студента писать?
Д.С.: Тяжело даже заставить читать. Писать – это следующий этап. Приходит студент, говорит: «Мне вот надо курсовую на такую-то тему». Ты говоришь: «Поищи в интернете, там все это есть». А он не знает, где искать, как искать, не знает, что ему почитать, чтобы написать эту курсовую. Поэтому что он делает? Идет в банк рефератов, что-то оттуда берет и использует. Из-за этого в студенческих работах так много плагиата. В этом плане мне очень нравится фраза Ивана Засурского о возникновении фальсифицированной отчетности: сначала одно поколение списывало курсовые и дипломы; потом оно стало списывать статьи и диссертации; сейчас эти люди подросли и стали списывать отчёты. Это правда, все происходит именно так.
— Вы как-то взаимодействуете с государством?
Д.С.: Сейчас мы стали достаточно большими. И мне кажется, у некоторых чиновников появились опасения, что завтра мы можем сказать: «А, ладно, хватит…». Им – или даже нам вместе – надо что-то придумать для того, чтобы наш ресурс стал устойчивым и никуда не исчез. Фактически все эти годы мы занимаемся тем, что общаемся друг с другом, объясняем, пытаемся что-то придумать.
— Вы просите финансирование?
Д.С.: Мы пытаемся придумать какие-то связанные проекты. Цель – сделать «КиберЛенинку» устойчивее, чтобы она жила сама, чтобы она ни в коем случае не зависела от нас. Даже когда мы общаемся между собой, мы говорим о том, что не хотим заниматься этим всю жизнь. Мы подняли этот проект, показали, что он действительно работает, что открытый доступ – это абсолютно нормально и востребовано. Дальше должна быть или какая-то поддержка, или какие-то заинтересованные люди. Это важно. Поэтому сейчас, в частности, с чиновниками Министерства образования и науки мы говорим о том, что надо построить соответствующую инфраструктуру.
— Как Вы развивались?
Д.С.: Сначала об издательствах. Первый, самый сложный этап мы преодолели за счёт каких-то своих контактов. Когда впервые приходишь к издателю, он не сразу понимает, зачем ему это нужно и нужно ли вообще. Сейчас в этом плане значительно проще, потому что издательства сами идут к нам. Их не надо искать, не надо уговаривать, потому что им выгодно размещать свой контент у нас. Здесь нужно сказать, что наши отношения с любым некоммерческим издательством безвозмездны. Мы друг другу ничего не платим.
Михаил Сергеев: По поводу аудитории – мы просто умеем работать с контентом, мы умеем его обрабатывать, подготавливать для поисковых систем, для аудитории, для интернета. Интернет-маркетинг – это наше направление.
— У Вас есть социальные сети?
Д.С.: Да, конечно. Сейчас во «ВКонтакте» у нас почти 150 тысяч пользователей. Два года назад мы выиграли грант от ВК как лучший паблик 2014 года. В гранте был прописан бюджет на рекламу, по-моему, 20 тысяч долларов. Это примерно полмиллиона рублей. Их можно было потратить только на рекламу в самой социальной сети. Но, конечно, большая часть аудитории – органика.
Если говорить о Facebook, там у нас больше 30 тысяч подписчиков. Для Facebook’а это много. В Twitter`е у нас примерно 18 тысяч.
Чем мы отличаемся от других медиа? У них основной трафик идет из соцсетей, а у нас – из поисковиков.
— «КиберЛенинка» у многих ассоциируется с Ленинской библиотекой. Многие говорят: «О, отлично Ленинская библиотека, как подросла, смотри-ка, а дизайн какой хороший, а какое оформление!». С этим проблем не было?
Д.С.: Да, такая ассоциация действительно есть. Так думает подавляющее большинство людей. Иногда даже нам высказывают: «Вы же там с Ленинкой работаете, они, наверное, платят вам что-то». Первоначально это работало на нас. Конечно, мы были знакомы с руководством РГБ, мне даже довелось какое-то время с ними работать. Александр Вислый, бывший директор библиотеки (ныне директор Российской национальной библиотеки – прим. авт.), в своё время поддержал наши начинания.
Года через два-три эта ассоциация начала работать на них. Мы показали результат, все его увидели. Теперь большинство говорит: «Наконец-то у нас государственная организация сделала что-то клёвое!». Я считаю, что мы квиты. Они нам помогли на старте, мы им помогли потом и продолжаем, наверное, делать это сейчас.
М.С.: Нас очень часто сравнивают и с НЭБ (Национальная электронная библиотека – прим. авт.), которая существует, но не работает. Например, в начале этого года ЦЭМИ РАН сделал отчет по общественному достоянию. Там есть глава, посвященная библиотекам. В ней сравниваются две модели доступа. В НЭБе доступ ограничен, непонятно, куда зайти, где и что можно найти. У нас по-другому: все наши научные статьи находятся в открытом доступе. И, в общем-то, в этом отчете рассказывалось, что эти модели дают.
Д.С.: Оказалось, что посещаемость нашего ресурса в 10 раз больше, чем посещаемость НЭБа. У них там, скажем, 1,5 миллиона объектов, у нас – 1 миллион. При этом на НЭБ потратили уже больше миллиарда рублей, а мы, наверное, свой бюджет даже озвучивать не будем, потому что он не то чтобы в половину, во много раз меньше, а по сравнению с этими бюджетными деньгами – сущие копейки. Вислый тогда сказал, что посещаемость порталов неправильно посчитали, хотя речь шла об открытых общепризнанных системах подсчета статистики, Яндекс.Метрике и Google Analytics.
М. С.: Многие говорят, что мы пираты. При этом сначала утверждают, что мы непопулярны. Это два взаимоисключающих утверждения.
Д.С.: Пираты наоборот популярны, потому что они просто крадут откуда-то материалы, выкладывают их, а потом тысячи людей смотрят и скачивают фильмы, которые ты выложил, читают твои книги. Отличный пример – Sci-Hub, крупнейший поставщик западных научных публикаций, который содержит порядка 52 миллионов статей.
— Западные университеты довольно часто выкладывают в открытый доступ бесплатные лекции, доклады, всевозможные диссертации.
Д.С.: Ну, если сравнивать с нами, то да, они выкладывают значительно больше, но системы все равно нет. Порой попадаются хорошие интернет-архивы, с которым мы всегда пытаемся сравнивать себя, например, «Архив» (ArXiv.org) Корнельского университета, которому больше 25 лет. Они собрали более миллиона статей по физике и математике, и сейчас ими пользуется весь мир. Ученые в этих областях без него вообще не могут жить, для них это ресурс номер один, он бесплатный, без всяких подписок. Туда заходишь и ищешь то, что тебе нужно. Но он идёт вразрез традиционно сложившейся системе платной подписки, платной публикации, в которой крутятся огромные деньги.
Сейчас, конечно, ситуация медленно, но меняется. В этом отношении Голландия является хорошим примером. Она стала одной из первых стран, которая начала систематически заниматься этой проблемой и пытается открыть для своих граждан доступ ко всем публикациям голландских ученых. Это очень хорошая инициатива и очень хороший пример для других. Мы думаем примерно о том же, но все это непросто. Для решения такой задачи необходима, во-первых, некая государственная программа и, во-вторых, финансирование – возможно, опять же на государственном уровне. Сейчас тратятся огромные деньги на национальную подписку, при этом эффективность этих многолетних трат решили подсчитать только сейчас, задумались о том, есть ли смысл тратить каждый год несколько миллиардов рублей.
А есть ведь и другие пути: например, что будет, если мы возьмем и часть этих денег потратим на то, чтобы по примеру голландцев выкупать научные статьи? Какой эффект это даст?
— А сами голландцы уже поняли, к чему это может привести?
Д.С.: Они прошли только половину пути. Сначала они обещали полностью закончить с этой историей к 2020 году, но когда стало ясно, что не успеют, перенесли на 2022. Результаты мы увидим. Но поскольку процесс долгий, чтобы не отстать, его уже сейчас пора начинать и у нас.
— Я никогда не видела на «КиберЛенинке» диссертаций или крупных исследований. С чем это связано?
Д.С.: Когда зарождалась библиотека, мы брали самый простой способ получения контента. Мы договариваемся с изданиями – оно отдает нам весь контент. Если бы это были книги или диссертации, мы бы были вынуждены договариваться с каждым автором, с каждым издательством. Даже крупные библиотеки, та же Ленинка, говорят о том, что они не обладают такими ресурсами – и финансовыми, и человеческими. Это невозможно.
— Многие говорят, что научные тексты в интернете рассредоточены. Есть представление о том, как их можно систематизировать?
Д.С.: Для этого необходима некая госполитика, чтобы каждая научная публикация российского ученого была всегда доступна. Для этого необходимо построить инфраструктуру, чтобы были хранилища, правовой стандарт, идентификация. Совокупность всего этого приведет к тому, что обычный потребитель – мы с вами – сможет в два клика найти все, что ему необходимо. Сейчас это невозможно.
М. С.: Сейчас можно, но только через нас. А если мы завтра пропадем?
Д.С.: Мы – это островок. Есть островки побольше, есть поменьше. А должен быть целый континент, на котором все есть.
— Какую роль будет играть «КиберЛенинка» в проекте Ассоциации интернет-издателей «Ноосфера. Запуск»?
Д.С.: На данный момент «КиберЛенинка» является одной из самых крупных бесплатных электронных библиотек открытого доступа. Мы находимся в 10-ке мировых ресурсов. Федеральная резервная система банков знаний – это попытка построить инфраструктуру открытой науки, о которой мы говорили. Исходя из этого наше участие в этом проекте достаточно очевидно: мы просто одни из поставщиков знаний.
— С кем Вы сотрудничаете?
Д.С.: Сейчас мы пытаемся выстроить отношения с ЕГИСУ НИОКТР (Единая государственная информационная система учета результатов научно-исследовательских, опытно-конструкторских и технологических работ гражданского назначения – прим. авт.). Они с 2015 года дают возможность ученым заливать на сайт диссертации и отчеты под открытыми лицензиями. Это была инициатива со стороны Минобрнауки России в лице Сергея Матвеева, исполняющего обязанности директора Департамента науки и технологий, которую мы всячески поддерживаем. Она стала возможной благодаря указу, подписанному Дмитрием Медведевым, который дает право ученым распространять результаты своих научных исследований по открытой лицензии. Раньше такого не было.
Почему это важно? Например, я – сотрудник РАН. Любая работа, которую я напишу, принадлежит и мне, и организации. Если я хочу ее куда-нибудь выложить, то чисто формально я должен спросить разрешение у организации. Сейчас эта система изменилась. Автор может сказать: «Я не планирую никаких патентов. Мое исследование этого не предусматривает, я не предусматриваю получение патента и коммерциализацию». А такое у нас бывает в 90% случаев (если же мы говорим о гуманитарных науках, то и во всех 100%). И сейчас у такого ученого есть возможность отдать результат научной работы под открытой лицензией, и государство это учитывает. Насколько я знаю статистику, только за 2015 год более половины защищенных диссертаций у нас в стране лежат там под открытой лицензией. И, как я уже сказал, там складываются научные отчеты. Правда, это специфический контент, его лучше никому не показывать.
— Может быть, эти отчеты понадобятся другим ученым, которым тоже нужно писать отчет по гранту?
Д.С.: Ученые не будут их читать. В каждом таком отчете по 1-2 тысячи страниц; нам как-то рассказывали о том, когда четыре стола были уставлены коробками из-под бумаги с этими отчетами. Там было больше 20 килограмм, и все это – отчеты!
— Отчеты – это технически необходимая деталь исследования?
Д.С.: Вы не сдадите проект, если не напишите грантооператору такой отчет. У нас государство до сих пор измеряет качество работы количеством листов, весом, и т.п. и т. д. Поэтому в отчет скидывают все, что есть, понимая, что никто его читать не будет. Смысла выкладывать такие отчеты нет, он нужен для аналитики. Ни простой пользователь, ни ученый никогда в жизни не будет читать 1000 страниц какого-то отчета. Диссертация на 100-200 страниц – это уже много. Это книга, это монография. Их-то мало кто читает. А статья – это оптимальный объем, 10 страниц, сел и тут же прочитал.
— Как Вы планируете продвигать проект в дальнейшем?
Д.С.: Самый очевидный способ продвижения – это статьи. У нас же миллион статей. Все, что нам нужно – научный редактор, который будет выбирать эти статьи и показывать их аудитории. Их просто нужно красиво анонсировать. Мы делаем это, но очень редко. Запостим один-два раза в неделю и все.
— У вас 150 тысяч подписчиков. Это говорит о колоссальном спросе!
Д.С.: На самом сайте 3 миллиона посетителей в месяц. За 2015 год нас посетило 22 миллиона человек. Это пятая часть населения России.
— И Вы не зарабатываете на рекламе?
Д.С.: На рекламе нельзя заработать. Максимум, что мы получаем с нее – это деньги на оплату хостинга. В этом смысле реклама дает на порядок меньше, чем нам нужно, чтобы этот проект тащить. Поэтому мы вынуждены продолжать вкладывать в него свои деньги.