В чем вы видите главную цель проекта?
Геннадий Еременко: Основная задача проекта РИНЦ - создать базу данных, где полно и объективно была бы представлена информация о научных публикациях российских ученых. В идеале каждому автору в создаваемой базе данных должен соответствовать весь список его журнальных публикаций, независимо от того, где и когда была опубликована статья - в частности, в российском издании или зарубежном. Тогда можно было бы говорить об объективной картине научного публикационного потока в стране.
Павел Арефьев: Но на этом пути есть сложности. Проблему публикаций в российских журналах мы на первом этапе решаем в рамках РИНЦ. Вопрос в том, как получить информацию из зарубежных источников. Скажем, из зарубежных систем научного цитирования. Мы уже долгое время ведем переговоры с Web of Science (компанией Thompson) и Scopus (компанией Elsevier). Я думаю, что, в конце концов, мы с кем-то из них договоримся и сможем разместить у себя библиографию публикаций российских авторов не только в российских, но и в западных журналах. А пока приблизительно седьмая часть российского публикационного потока остается вне охвата РИНЦ.
Вы уверены, что седьмая? Разве по физико-математическим наукам не все 80%? Кажется, что ведущие ученые, представители этих дисциплин, публикуются в основном в зарубежных журналах.
ГЕ: Конечно, по разным наукам часть не охваченных создаваемой системой статей разная. Если брать совокупный публикационный поток, то в том же Web of Science ежегодно появляется около 27 тыс. новых статей из России. Из них в области физики и математики где-то около 10 тысяч. Мы в РИНЦ обрабатываем не менее 150 российских физико-математических журналов, что составляет порядка 18 тысяч статей в год. Таким образом, по физике и математике только треть статей наши ученые публикуют в зарубежных журналах. По другим наукам это соотношение еще выше. Вы, скорее, правы в том смысле, что ведущие ученые публикуются в основном на Западе. Это, кстати, хорошо было бы и проверить, используя РИНЦ.
ПА: Всего в РИНЦ мы сейчас обрабатываем около 1500 научных журналов. В среднем, в российском научном журнале публикуется примерно такое же количество статей, что и на Западе, где-то около 120 статей в год. Соответственно, общий поток, проходящий через РИНЦ, - около 180 тысяч статей в год.
Это то, что делают российские ученые за год?
ГЕ: То, что публикуют российские журналы, которые мы сейчас обрабатываем. Наверное, там появляется немало "мусора", но публикуется и много статей хорошего уровня. Я говорю именно о статьях, а не о журналах. Потому что в одном издании могут появиться как откровенно слабые статьи, так и достаточно серьезные и вполне оригинальные, и даже работы мирового уровня. К сожалению, многие российские журналы страдают проблемой нестабильности и неоднородности качества журнала.
Скажите, пожалуйста, каковы основные трудности при переговорах с западными индексами цитирования? Какие требования они к вам предъявляют и почему им может быть интересен РИНЦ?
ГЕ: Западным коллегам РИНЦ не особенно интересен. В первую очередь, получение информации из Web of Science и Scopus необходимо нам. У них свои устоявшиеся системы, определены правила. Они включают в свои базы данных те журналы, которые подпадают под их правила (в основном, кстати, переводные, англоязычные). Мы же хотим обработать по максимуму статьи, а возможно, и книги всех российских ученых. Нам нужна информация об этих публикациях. Более того, мы готовы заплатить западным компаниям, чтобы эту информацию получать максимально быстро, полно и т.д. Однако для них такая схема работы непривычна, им гораздо проще зарабатывать деньги путем организации подписки различных организаций на свои услуги. Мы же предлагаем им достаточно непривычную модель работы, в рамках которой им необходимо разработать новую лицензию на такую услугу.
ПА: Мы ведь эту информацию о научных публикациях выставляем в открытый доступ - естественно, что западные компании сразу начинают задумываться, а как это? А почему это? А сколько такое может стоить? Не подорвет ли это их продажи в России?
ГЕ: Они не знают, как это оценить, но, тем не менее, переговоры ведутся. Мы заинтересованы в том, чтобы они предоставляли нам информацию обо всех публикациях российских авторов, их библиографические описания и хотя бы количество цитирований этих публикаций, а по возможности - перечень библиографических записей, где цитируются статьи российских авторов. По большому счету, на данном этапе нам этой информации было бы достаточно, чтобы объективно проводить расчеты по всей совокупности российских научных публикаций.
Если сейчас подписаться и начать пользоваться этими базами данных, скачивать оттуда необходимую информацию, будет ли это нарушением лицензии? Или же это трудно с технической точки зрения?
ГЕ: Технически не составляет никаких проблем забирать оттуда информацию, обрабатывать её и загружать в нашу базу. Но если мы это сделаем без договоренности, то это, конечно, будет неправильно. Потому что, во-первых, по лицензионному соглашению мы не можем систематически извлекать какие-то данные, это запрещено, и, во-вторых, мы не имеем права показывать эту информацию кому-либо еще. Даже импакт-факторы журналов, как вы, может быть, знаете, нельзя показывать широкой публике.
ПА: Хотя многие публикуют эту информацию. Сейчас компания Thompson закрывает на это глаза, а раньше она с этим боролась.
ГЕ: Научный журнал может поставить импакт-фактор своего журнала из Web of Science на страничке своего издания в интернет, но когда в некоторых журналах или на сайтах публикуются таблицы с импакт-факторами различных журналов, то это уже нарушение авторского права компании Thompson Reuter. Поэтому зачастую документы, которые рождаются в различных ведомствах, где предлагается что-то оценивать, рассчитывать и учитывать на основе зарубежных импакт-факторов, на самом деле, не всегда учитывают тот факт, что прежде чем начать использовать эти импакт-факторы, организация должна на эту продукцию подписаться. А это уже большие деньги.
Может быть, стоит сделать закрытый доступ в РИНЦ и объявить на него не очень высокую цену? Допустим, 20 долларов в год.
ГЕ: В ближайшее время мы этого делать не будем. Во-первых, для того, чтобы организовать платный доступ, нужно создать реально функционирующий качественный продукт. Пока нам еще есть над чем поработать и по составу информации, и по уровню наличия ошибок, и по количеству обработанной информации, и по более точной идентификации организаций, где работают авторы статей, и идентификации самих авторов. В рамках РИНЦ еще очень много работы.
Во-вторых, пока этот проект финансируется государством, он будет открытым и, соответственно, бесплатным. И, в-третьих, вся та часть, которая входит в РИНЦ, - практически вся его нынешняя функциональность, - скорей всего, так и останется в открытом доступе. Если мы будем развивать какие-то коммерческие вещи, то это, скорее всего, будут надстройки аналитического плана, где на основе базовой информации пользователям будут предлагаться статистические и аналитические отчеты. Это, может быть, станет отдельным коммерческим продуктом, но пока нам особенно некогда этим заниматься. Нам нужно довести РИНЦ до нормального состояния в рамках поставленной основной задачи.
ПА: Вообще тенденция существующих национальных индексов в плане распространения такова: приходите и смотрите. Таков, например, японский индекс цитирования, он открыт для всех. Оба китайских индекса тоже открыты для публики. Правда, на китайском языке, что несколько сужает аудиторию до каждого четвертого жителя Земли.
Будете ли вы договариваться с японцами, чтобы они предоставляли вам данные по публикациям российских ученых?
ПА: Пока нет, нам бы договориться со Scopus и WoS. Я думаю, что уже это было бы неплохо. Потому что в случае интеграции с ведущими базами научного цитирования можно было бы сказать, что российские ученые оцениваются более или менее объективно. Кроме того, сомневаюсь, что много российских авторов публикуются на японском языке.
А уже можно говорить о каких-то подвижках в переговорах? Есть ли какие-то прогнозы?
ГЕ: Обе организации, Thompson Reuter и Elsevier, достаточно большие и забюрократизированные. Если мы даже достигаем каких-то договоренностей с их менеджерами на уровне торговых представителей, то пока всё это дойдет до руководства и юридического отдела... Поэтому пока рано говорить о чем-то конкретном, но, скажем так, положительные тенденции есть. Вполне вероятно, что в течение ближайшего года мы все-таки договоримся и сможем использовать их данные. Для нас это сейчас очень важно.
Кстати, одним из положительных моментов в плане намечающегося сотрудничества между Научной электронной библиотекой и компанией Elsevier является и тот факт, что ежегодную церемонию награждения лучших российских авторов в области научно-технической и медицинской литературы Scopus Russia Award 2008 мы в этом году провели совместно, уже на основе данных из РИНЦ и Scopus.
Читаете ли вы критические публикации о РИНЦ?
ГЕ: Критику мы отслеживаем и вполне чувствуем. Есть замечания полезные, часть из них мы уже обсудили и кое-что внесли в РИНЦ. Есть вещи, которые требуют немалого времени, чтобы привести информацию к нужному качеству.
Вам было бы вам интересно участвовать в живых диалогах с пользователями?
ПА: Ну, мы никогда не закрывались от дискуссий. Хотя вести споры на интернет-форумах просто нет времени. Лучше общаться живьем, это и приятнее, и полезнее. Сейчас мы принимаем участие в 20-25 различных конференциях, семинарах и выставках в год. Кстати, семинары и конференции мы регулярно проводим и сами, и всегда рады, если в них участвуют неординарные личности, с которыми интересно вести диалог.
ГЕ: Но все дело в том, что это, может быть, иная аудитория. Это библиотекари и издатели. Наверное, стоило бы вступить в более тесный диалог с учеными, которые, прежде всего, будут являться потребителями РИНЦ. Они нас, кстати, критикуют чаще. Тем не менее, мы готовы к диалогу с ними. Потому что сам по себе проект интересный. И не вполне однозначный. Это можно было бы обсудить. А также послушать, что люди думают о дальнейшем развитии РИНЦ, какие дополнительные сервисы нужны, как можно улучшить работу с индексом. У нас много разных планов, мы далеко не всё пока рассказываем. Нет смысла говорить о том, что еще не открыто для публики.
Некоторые ученые выражают сомнения в самой необходимости разработки национальных индексов цитирования. Вы сами сказали о неоднозначности проекта.
ГЕ: По поводу того, нужен ли вообще такой проект, я бы сказал так: показатели цитируемости - та функциональность проекта, которая широко обсуждается как основное предназначение проекта, на самом деле, является, конечно, важной, но, на мой взгляд, далеко не самой главной.
Что же вы считаете основными достижениями проекта?
ГЕ: Во-первых, создается максимально полная библиографическая база данных журнальных публикаций российских ученых. Такой глобальной базы никогда, на самом деле, не было. Еще несколько лет назад было очень сложно найти информацию, где, когда и какой автор опубликовал статью в российском журнале. В единой базе, в единой системе поиска этого не было. Да, есть системы глобального поиска по электронным каталогам российских и западных библиотек, но там отражаются книги, а не статьи из журналов. Да, есть в стране такие организации, как ВИНИТИ или ИНИОН, которые создают базы по статьям из журналов. Есть Российская книжная палата, где ведется летопись статей. Но все это либо выборочное описание, описание не всех статей из выпусков, либо полное, но по ограниченному кругу научных журналов. Теперь, с помощью РИНЦ, провести такой поиск и найти полную информацию - это уже не проблема.
Включение в эту библиографическую базу данных списков пристатейной литературы дает новое очень полезное средство навигации по научным публикациям - возможность перехода по ссылкам из этих списков на другие статьи. Можно перейти по ссылке на цитируемую статью, или наоборот, перейти на статью, цитирующую данную, и почитать как минимум её описание, а может быть и полный текст, если он есть и доступен.
Ну и, наконец, еще одним из побочных результатов проекта является то, что в рамках создания РИНЦ быстро растет и полнотекстовая база данных российской научной периодики. Уже сейчас из 1500 обрабатываемых в РИНЦ журналов более половины доступно в полнотекстовом виде на платформе eLIBRARY.RU. Еще пару лет назад было проще найти перевод статьи в англоязычной версии журналов академического издательства "Наука", чем российский оригинал этой статьи в электронном виде. Теперь эти журналы на русском языке тоже стали доступны для российских ученых.
А есть ли какая-то разбивка по дисциплинам?
ПА: Разбивка по дисциплинам полностью совпадает с тем, что есть у Web of Science. Т.е. две трети - это технические науки, прикладные и фундаментальные естественные науки. И треть - гуманитарные. Если разбивать блок того, что входит в Web of Science, то порядка 25-27% - это технические и прикладные науки, 30% - это социогуманитарные науки, 43-45% - это блок естественных наук. Из них можно вычленить порядка 15-18% - Life Science, науки о жизни, биология и медицина.
Расскажите, пожалуйста, как вы добавляете в базу новый журнал?
ПА: В России издается около 3600-3700 периодических журналов, которые можно отнести к разряду научных изданий. Из этой массы изданий цитируются хотя бы с некоторой частотностью только 1500. Это означает, что 2000 изданий либо вообще не цитируются, либо цитируются крайне редко. Это не означает, что мы никогда не добавим такие малоцитируемые журналы в базу. Просто они и в случае попадания в РИНЦ будут находиться в "хвосте" ведущих журналов.
Сколько цитирований должно быть у журнала, чтобы он попал в ваш рейтинг?
ГЕ: У нас нет как такового порога, у нас есть задание, которое мы выполняем в рамках государственного контракта. В 2009 г. РИНЦ должен включать не менее 1500 журналов. Поэтому мы отобрали 1500 лучших журналов по показателю цитируемости и обрабатываем их.
А откуда взялась эта цифра - 1500?
ГЕ: Такое задание поставлено Федеральным агентством по науке и инновациям, с которым у нас заключен контракт. В принципе, мы считаем, что вполне достаточно обрабатывать не более 1000 самых цитируемых журналов, а те, что располагаются в рейтинге цитирования за этим порогом, откровенно говоря, слабые. Судите сами: 1500 самых цитируемых российских журналов получают 96% от всего объема ссылок на российские журналы. А 1000 самых цитируемых журналов получают около 92% (т.е. на долю 500 изданий приходится всего 4% ссылок).
С другой стороны, на первых порах нужно сделать захват побольше, чтобы потом из более широкого списка журналов можно было бы выбрать 1000 действительно хороших изданий. Относительно хороших. Потому что действительно хороших журналов международного уровня в России, наверное, несколько сотен. А то и десятков.
Кстати, если уж рассматривать значимость и миссию этого проекта, то очень важным, как мне кажется, моментом является также то, что РИНЦ влияет положительным образом на российские научные журналы, способствует повышению их качественного уровня. Когда мы начинали, мы часто сталкивались с удивительной вещью. В российских издательствах не понимали, как важно сейчас иметь электронную версию журнала в Интернете, не знали, что такое импакт-фактор журнала, и многого другого. Причем даже в издательствах вполне известных и солидных.
ПА: Около трети издательств вообще не присутствовали в Интернете. Еще три года назад в Рунете было представлено, по нашим оценкам, не более 100 полнотекстовых научных журналов. Сейчас только в нашей базе их уже более 800, и свыше 300 из них доступны всем желающим. Остается еще проблема раздробленности издательского сегмента. У нас сейчас обрабатывается 1500 журналов; это 730-740 издателей. Если в мире издается порядка 125-127 тыс. научных журналов в год, и их издают около 4500 организаций, т.е. по 25 журналов на издателя, то в России в среднем приходится по 2 журнала на одного издателя.
Может быть, хорошо, что есть такое многообразие, и нет монополизма?
ГЕ: Ничего хорошего в этом на самом деле нет.
ПА: Это приводит к тому, что во многих издательствах существует технологическая отсталость. Невозможно сконцентрировать финансовые, человеческие, технические ресурсы. И от этого возникает отставание от западных коллег.
ГЕ: Во многих издательствах не выдерживаются стандарты издательского дела. Научный журнал - достаточно консервативная область деятельности, где эти издательские стандарты сформировались давно, и все зарубежные журналы им соответствуют. А наши журналы издаются - кто во что горазд. Существует и масса других проблем. Любой уважающий себя журнал должен выдерживать четкую периодичность выпусков, минимальные сроки публикации, качество оформления и т.д.
ПА: Плюс наличие (вернее, в большинстве случаев отсутствие) некоторых формальных вещей. Того же международного номера сериального издания, ISSN. Вроде бы к чему ISSN? Однако это является признаком того, что издание - официальное, что оно соблюдает ряд формальностей.
Неужели некоторые российские журналы не имеют ISSN?
ПА: Не некоторые, а большая часть всех научных журналов!
Разве можно выходить без ISSN?
ГЕ: Почему нет?
Мне казалось, что это требование предъявляется при регистрации издания.
ГЕ: Это, скорее, требование при выходе на международный рынок или уровень, чтобы журнал попал в международную базу данных всех изданий. За рубежом номер ISSN часто используется как уникальный номер журнала, как его код.
ПА: Да, это одно из основных поисковых требований.
ГЕ: На самом деле, процедура получения ISSN достаточно проста и бесплатна.
ПА: Очень многие наши издатели считают, что ISSN должны выдаваться в России. До недавнего времени Российская книжная палата выступала в качестве представителя международной организации, которая находится в Париже и выдает ISSN. Номер выдавался по письменному заявлению учредителей, по предъявлению некоторых атрибутов издания: нужно было представить несколько номеров журнала, их описание и т.д. Однако ISSN выдавался лишь через 2-3 месяца, а то и через полгода после подачи заявления, и за выдачу номера взималась плата.
Это нарушение?
ПА: Возможно, и не нарушение. Но это не так важно сейчас, поскольку если вы самостоятельно зайдете на сайт www.issn.org, заполните анкету на свой журнал, введете все необходимые реквизиты журнала на английском, французском или немецком языках (на русском пока нет), то в течение 3 недель, если соблюдены все правила, вы совершенно бесплатно получите ISSN.
Наверное, издатели этого просто не знают.
ГЕ: Так вот это как раз то, про что я начал говорить. На самом деле, наша функция как раз и заключается в том, чтобы помогать издательствам. Мы их приглашаем и на конференции, тренинги, мероприятия, где рассказывается про все эти вещи. Перед нашими издателями выступают зарубежные коллеги, они могут узнать о том, как сделаны порталы зарубежных издательств, какие сервисы существуют. Тот же Cross Reference - сервис, когда каждой статье выдается уникальный идентификатор.
ПА: Или DOI - Digital Object Identifier.
ГЕ: Многие наши издатели не знают и про него. А на самом деле это очень полезная вещь. Каждая статья получает уникальный код, который, в отличие от библиографической ссылки, может быть распознан без ошибок. Сделав запрос в crossref.org по номеру DOI, вы получаете не только описание этой статьи, но и ссылку на её полный текст на сайте издательства.
А у нас какие-нибудь журналы уже имеют DOI?
ГЕ: Они есть у переводных журналов издательства "Наука", которые издательство Springer распространяет за рубежом.
ПА: Сейчас некоторые русскоязычные журналы также начали публиковать DOI номера. Например, журнал "Успехи физических наук" и некоторые другие. Свой уникальный DOI-номер получает как сам журнал, так и каждая статья в нем. Если открыть зарубежный журнал, то на первой страничке любой статьи указывается этот код.
Какое еще отставание от западных коллег вы могли бы отметить у российских журналов?
ГЕ: Их очень много. У нас есть целая система оценки журналов по таким формальным и неформальным параметрам, которые, конечно, отражают не научное содержание, а именно соответствие издательским стандартам. Эти стандарты в немалой степени влияют на выполнение главной задачи журнала - представить хорошие научные статьи, обеспечив им максимальное распространение. Если журнал может влиться в зарубежную систему распространения, индексирования, войти во все зарубежные базы цитирования, то у него самого вырастет и цитирование, и соответственно, импакт-фактор будет выше.
Две вещи, которые влияют на импакт-фактор. Первое - это научный уровень журнала как таковой и второе - насколько он может интегрироваться в существующую систему распространения. Цитирование статьи тем выше, чем выше её научный уровень, и чем больше ученых смогли с ней ознакомиться. Наши журналы пока не все это понимают, они привыкли работать через "Роспечать", где им дается подписной индекс Роспечати, организуется подписка и пр. На этом их познания о системе распространения заканчиваются. А для включения в библиографические базы нужны, как минимум, аннотации на английском к каждой статье, английские библиографические описания по каждой статье, чтобы зарубежным системам можно было описать содержание журнала хотя бы на уровне аннотаций. Только в этом случае журнал имеет возможность стать заметным на международном информационном поле.
ПА: И мы еще не затронули одну из самых глубоких проблем наших научных журналов, в смысле глубины падения, - проблему авторского права. Кто из издателей журналов заключает договора с авторами? А ведь это влияет на последующее распространение журнала.
Редакциям журналов нужно заключать договора с учеными?
ПА: Да, со всеми авторами. В зарубежных издательствах с авторами в обязательном порядке заключается договор. Это - норма. При издании книг это уже всем понятно, а договоров с авторами научных статей в наших журналах - очень мало. Издательств, которые это делают, почти нет.
Сейчас столько уже журналов с Open Access.
ПА: Это отдельная тема - очень интересная. Там есть два пути: зеленый - когда автор сам загружает препринт своей статьи (это пока не статья) и желтый - когда он еще и платит за публикацию в таком журнале. В любом случае, с авторами заключаются договоры. Иначе как потом статья будет распространяться?
Как обычно - в журнале.
ГЕ: В российских журналах существует неформальный устный договор. Сейчас ситуация с учетом нынешних нововведений в законодательстве по авторским и смежным правам меняется, по крайней мере, в той части, что касается электронных версий журналов. Устного договора здесь уже недостаточно.
Во второй части интервью сотрудники проекта расскажут о том, как работает проект, как включаются в базу данных научные журналы, о взаимодействии РИНЦ с ВАКом, о проблемах в описании библиографических ссылок в российских научных изданиях.