11 февраля 2019

"КиберЛенинка": В ожидании пересборки

О цифровизации системы оборота научной информации сегодня говорят на ведущих отраслевых площадках. А открытость знаний и индивидуальность траектории обучения и исследований становятся фундаментом для новой инфраструктуры образования. Безусловно, ведущую роль в этой экосистеме будут играть технологии, цифровые архивы и платформы, которые предложат исследователям оптимальные условия для создания и распространения научного знания.

semyachkin

О ближайших перспективах и стратегических планах реализации таких сервисов, новых алгоритмах работы с научной информацией и рекомендательных системах мы беседуем с основателем крупнейшего российского ресурса — научной электронной библиотеки «КиберЛенинка» Дмитрием СЕМЯЧКИНЫМ.

— Дмитрий, тема открытого доступа и открытых знаний активно продвигается в сообществе последние три-четыре года, однако Ваш проект «КиберЛенинка» (КЛ) стартовал ещё в 2012-м. За прошедшее время ресурс получил очень серьёзное развитие, став лидером в своей области. Поделитесь основными вехами развития и итогами уходящего года. Какова статистика пользователей, показатели пополнения фондов КЛ, формирования её коллекций и их использования? Какие темы наиболее востребованны?

— Человеческой коммуникации сегодняшнего дня свойственна высокая скорость. Технологии сделали информацию легко доступной огромному числу людей, а общение — намного быстрее. Однако некоторая информация остаётся невостребованной вне зависимости от её качества. Происходит это прежде всего из-за её закрытости и применения нецифровых моделей распространения. Для большинства людей (особенно молодого возраста) эта информация не становится знанием и соответственно никак не участвует в образовательном процессе, даже если при этом она доступна в сложных библиотечных системах и архаичных издательских сервисах, обеспечивающих подписку.

На наш взгляд, чтобы информация была востребованна, должны выполняться два условия: 1) она должна быть открыта и 2) необходимы технологии для её распространения. Этой формуле мы следовали, когда в 2012 г. запустили КЛ. Создав ресурс открытого доступа, мы продемонстрировали огромный спрос на знания в обществе, а наши результаты заставили всерьёз заговорить об открытом доступе в России: начиная с лиц, принимающих решения, и заканчивая студентами. Два года назад ЮНЕСКО привела КЛ в качестве примера инициативы использования открытого лицензирования научных и образовательных ресурсов.

В ушедшем году КЛ стала четвёртым открытым архивом мира (в последнем рейтинге Webometrics), обогнав такие известные ресурсы, как Academia.edu и arXiv.org. В 2018-м библиотеку посетили 29 млн человек, которые прочитали 148 млн статей, что на 30% больше, чем годом ранее. За год наши фонды выросли более чем на треть и сейчас включают 1,65 млн статей из 1750 журналов. Традиционно наиболее востребованными являются статьи по экономике, медицине и юриспруденции.

— Какова целевая аудитория КЛ? Какие сервисы Вы предлагаете своим читателям?

— Наши пользователи — это учащиеся и исследователи по всему миру, а также интернет-пользователи, интересующиеся какой-либо темой (модель потребления как у «Википедии»). КЛ позволяет десяткам миллионов людей в два клика бесплатно пользоваться современным знанием, и в этом состоит основная ценность ресурса. Издателям и исследователям КЛ обеспечивает многократное увеличение охвата их статей, в том числе посредством коммерческих сервисов.

— В прошлом году КЛ стала активно позиционировать себя на международном рынке. Каковы в целом основные тренды развития аналогичных сервисов за рубежом?

— Действительно, в октябре мы запустили новую площадку на международном рынке. Ресурс стартовал с почти 1 млн научных публикаций, распространяемых под открытыми лицензиями Creative Commons (СС). При этом принципы работы КЛ в России и за рубежом разные. В России мы занимаемся очисткой прав на научные журналы, заключая с каждым издательством безвозмездный лицензионный договор, после чего размещаем материалы на условиях СС. За рубежом уже есть много таким образом лицензированных научных журналов и отдельных публикаций, поэтому на первом этапе нового проекта мы собрали их в одном месте и предоставили пользователям набор сервисов для удобной работы с этой информацией: поиск, рекомендации для чтения, каталогизация по областям знаний. Основной тренд в мире сейчас на открытость, об этом дальше расскажу более подробно.

В ближайших планах — совершенствование алгоритмов оперативного сбора и обработки научных публикаций под открытыми лицензиями, наращивание контента и аудитории площадки. «Новая» КЛ стратегически важна для нас, так как обеспечит расширение аудитории без затрат на маркетинг — это студенты, исследователи и все, кто нацелен на обучение и развитие во всём мире. Это позволит кратно масштабировать коммерческие сервисы и быть источником целевой аудитории для других проектов рынка онлайн-образования.

— Знаю, что в планах развития КЛ создание экосистемы знаний и запуск нескольких продуктов для науки и образования. О чём идёт речь?

— На данный момент мы видим очень серьёзные предпосылки к тому, что социальная сфера в ближайшие годы будет активно развиваться. Последний Всемирный экономический форум в Давосе и новые исследования McKinsey говорят о том, что через 12 лет 800 млн человек потеряют работу вследствие развития технологий. Однако как показывает история предыдущих промышленных революций, с исчезновением старых профессий появится много новых. Всё больше людей будет занято в таком производстве, где требуются навыки, не присущие искусственному интеллекту и роботам: креативность, эмоции, взаимодействие, преодоление, предпринимательство. И прежде всего это производство знаний и социальных благ с серьёзной мотивацией — быть причастным к проектам на благо общества, остаться в вечности, сформировать свою собственную репутацию, так называемый индивидуальный капитал.

Таким образом, рынок знаний в ближайшие 10–15 лет существенно вырастет. На сегодняшний день он оценивается в 5 трлн долларов США, при этом цифровая его часть составляет только 8%. Есть огромный потенциал его цифровизации. Эти тенденции определяют фокус нашей команды на ближайшие годы. Успех КЛ и большой интерес инвесторов к компании позволяют нам перейти от задач агрегации и распространения контента к его производству. Мы уже сейчас ведём разработку новой платформы, которая объединит поставщиков и потребителей знаний в глобальную экосистему. Пользователями платформы станут сотни миллионов человек по всему миру, которые учатся и исследуют. Сервисы на платформе составят единый инструмент, помогающий на всех этапах создания нового знания начиная от подбора нужных источников до его публикации и оценки влияния.

— Давайте поговорим о деньгах. На старте проекта КЛ поддерживалась разработчиками-энтузиастами. Сейчас ситуация изменилась; Вы привлекаете гранты и партнёров. Расскажите подробнее, кто финансово поддерживает КЛ? О каких бюджетах идёт речь? Какова сегодня капитализация библиотеки?

— В 2017 г. «КиберЛенинка» привлекла 30 млн рублей от Игоря Рыбакова (совладельца «ТЕХНОНИКОЛЬ» и Рыбаков Фонда). Внимание частного инвестора, яркого представителя крупного бизнеса — для нас это история не только и не столько про деньги, это smart money. Помимо инвестиций мы получили самого Игоря Рыбакова в качестве наставника по бизнесу и вышли на совершенно новый уровень. Мы счастливы, что к проекту присоединяются известные люди, усиливая нас. Например, в прошлом году нашим наставником по науке стал Константин Новосёлов — известный соотечественник, нобелевский лауреат 2010 г. по физике.

В ходе первого раунда привлечения средств капитализация КЛ выросла с 2 до 6 млн долларов США. Выход на международный уровень обеспечил её увеличение ещё как минимум в три раза. В 2019 г. планируется привлечь следующий раунд инвестиций для реализации платформы.

— Как развиваются коммерческие сервисы? Что это и на кого они рассчитаны? Как оцениваете перспективы новых моделей монетизации? С какими финансовыми итогами завершили год?

— В четвёртом квартале 2018 г. нам удалось утроить нашу выручку, 65% которой обеспечивает рекламная модель (включая пожертвования), ещё 35% — сервисная. Уже год работает сервис CyberDOI, позволяющий идентифицировать научные публикаций по международным стандартам. КЛ и CyberDOI вместе решают комплексную задачу по присвоению DOI научным публикациям и их долгосрочному хранению в цифровой среде.

В текущем году наша продуктовая стратегия будет состоять в развитии сервисной бизнес-модели с фокусом на B2C и увеличении её доли в общей выручке до 50%.

За полтора года с момента инвестиций мы увеличили выручку почти в пять раз, а в конце прошлого года вышли на самоокупаемость в части поддержки КЛ. Но при этом наши общие расходы продолжают расти и они будут покрываться за счёт будущих инвестиций.

— Искусственный интеллект, блокчейн, BigData, смарт-контракты — популярные темы для инновационного развития разных сегментов рынка. Планируете ли в дальнейшем использовать эти сервисы на Вашем ресурсе?

— Технологии искусственного интеллекта и машинного обучения уже давно применяются нами для рекомендования работ и каталогизации статей по областям знаний. Кстати, «новая» КЛ работает на каталоге OECD (Организация экономического сотрудничества и развития), который пришёл на смену устаревшему ГРНТИ. В 2019 г. русскоязычная площадка также перейдёт на OECD.

Блокчейн нам нравится как красивая концепция, на которой легко представить цифровую пересборку существующей системы оборота знаний, благодаря чему могут произойти две важные вещи. Во-первых, сократятся трансакционные издержки, что обеспечит открытость, всеобщую доступность и высокую скорость обмена знаниями. Во-вторых, заработают механизмы управления цифровыми правами. Каждый человек, создавший информацию, использующуюся далее в производстве продуктов или новых знаний, будет увеличивать свой индивидуальный капитал, который может быть монетизирован.

— Как выстраивается взаимодействие с вузами, научными учреждениями и библиотеками?

— Мы успешно сотрудничаем со всеми перечисленными организациями и рады новым, сильным партнёрам, которые разделяют нашу миссию по пересборке отрасли научной информации и ускорению научной коммуникации. В КЛ представлены издания практически всех ведущих российских вузов, среди которых СПбГУ, НИУ ВШЭ, ТГУ и др. Мы верим, что те, кто пока по каким-то причинам не присоединился к нам, сделают это в наступившем году. Такая возможность обсуждается, например, с МГУ имени М.В. Ломоносова и издательством «Наука».

— В 2013 г. в интервью нашему журналу Вы рассказывали, что в развитии КЛ заняты 11 человек, причём всего шесть на постоянной основе. Как изменилась команда за пять лет?

— За это время количество сотрудников практически не изменилось. Ядро нашей команды — восемь человек, к которым при необходимости подключается ещё примерно столько же. С 2013 г. поменялось только одно обстоятельство — мы с Михаилом и Евгением (Михаил Сергеев и Евгений Кисляк. — Примеч. ред.) как основатели проекта теперь полностью заняты в нём. У нас capital efficient team, и, возможно, в этом состоит один из секретов нашего успеха.

— В том же интервью в качестве самых сложных моментов в развитии Вы назвали взаимодействие с издательствами и финансирование. О бюджетах мы уже поговорили, а как меняются отношения с правообладателями?

— За шесть лет ситуация с правообладателями улучшилась. Если на старте проекта нам приходилось убеждать издательства размещать журналы в КЛ под открытыми лицензиями, то теперь это приходится делать намного реже. Издательства самостоятельно приходят к нам с желанием, чтобы мы их усилили. В ушедшем году на нашей платформе появилось около 300 новых журналов. Большинство издателей понимают ценность, которую даёт КЛ. В одном из наших исследований мы показали, во сколько раз увеличивается охват журналов и индексация в Google Scholar благодаря их размещению на нашем ресурсе. С тех пор эта цифра ещё выросла и сейчас доходит до 10 раз.

— Как, на Ваш взгляд, изменится система распространения научной информации в ближайшие годы? Какие новые эффективные модели появятся, какую роль будут играть рекомендательные и экспертные сервисы? Возможна ли монетизация таких проектов?

— На мой взгляд, мы находимся в точке бифуркации отрасли научной информации, её глобальная пересборка неизбежна и является лишь вопросом времени. Почему? Во-первых, безусловный тренд на открытость научной информации прослеживается во всех последних европейских инициативах (Plan S), которые начинают поддерживать и другие ведущие страны, например Китай. Во-вторых, число научных публикаций стремительно растёт (ежегодно появляется примерно 2–2,5 млн новых) и ознакомиться с ними даже в самой узкой области специалисту становится всё более затруднительно (и практически невозможно для начинающих исследователей: студентов, аспирантов). Таким образом, путь учёного к фронтам науки удлиняется, а растущее количество производимых публикаций всё больше влияет на качество. Поэтому не вызывает сомнений, что будущее научного поиска лежит в сфере рекомендательных систем, способных строить индивидуальные траектории исследователей и обеспечивать их релевантной научной информацией. Известны прототипы, работающие на узкой выборке данных, например проект Meta, приобретённый в 2017 г. фондом Chan Zuckerberg Initiative. Коммерчески такие системы могут быть крайне успешны, так как станут фундаментом новой инфраструктуры знаний. Подобный сервис мы уже разрабатываем, он станет частью нашей будущей платформы.

— Ещё один тренд — развитие научных профессиональных сетей и сообществ и «прикрутка» к ним разнообразных сервисов (например, проект Mendeley). Развиваете ли Вы подобные направления коммуникации?

— Нам интересен этот тренд, и именно поэтому в нынешнем году мы запускаем новый сервис подбора литературы с менеджером библиографий. Это станет основой развития КЛ как профессиональной сети для исследователей во всём мире. Мы вступаем в конкуренцию на международном рынке с такими сервисами, как ResearchGate и Academia.edu. В России и на бывшем постсоветском пространстве КЛ является крупнейшей площадкой и значительно превосходит их по аудитории. В связи с этим мы видим интерес к нашей компании в отношении стратегического партнёрства.

— Поделитесь планами развития и поддержки новых проектов.

— Общий план развития компании состоит в последовательной реализации нашей миссии по созданию экосистемы знаний. Мы будем действовать как минимум по трём направлениям.

Первое — это бизнес-направление: привлечение раунда инвестиций и реализация MVP платформы для производства знаний. Мы фокусируемся на сервисах для учащихся и исследователей (B2C-сектор). Первым станет сервис подбора источников для чтения, который будет запущен в 2019 г.

Второе направление — некоммерческое: привлечение грантовой поддержки, в том числе от международных фондов, и наращивание базы знаний в открытом доступе. Усиление темпов роста контента и, следовательно, аудитории — наша стратегическая задача, и мы будем решать её благодаря подключению дополнительных моделей набора, не ограничиваясь только научной периодикой.

И третье — поиск сильных партнёров в разных форматах (стратегическое инвестирование, M&A и др.) для реализации важной задачи — ускорения обмена знаниями и их эффективной капитализации на благо всего общества и каждого человека в отдельности.

— Удачи в реализации всех планов!

Беседовала Елена Бейлина