Monday 17 April 2017

Профили организаций в Web of Science Core Collection

Свершилось! С апреля этого года все государственные научные организации России получили доступ к Web of Science (кстати, если вы - государственная научная организация из России, и по каким-то причинам по этой ссылке система всё ещё просит у вас логин и пароль, напишите, пожалуйста, в отдел электронных подписок ГПНТБ России по адресу el-podpiska@gpntb.ru, чтобы этот доступ заработал и у вас.

До сих пор у любого пользователя Web of Science рано или поздно вставала следующая проблема: как найти все публикации конкретной научной организации? Ведь разные авторы в разных источниках по-разному указывают название одного и того же института или университета, и, когда с вас требуют отчётность по публикационной активности или цитируемости, приходится основательно повозиться, чтобы найти все публикации - и это полбеды, ведь надо, чтобы и на той стороне поиск по публикациям провели точно так же.

Несколько лет назад у нас появилась возможность объединять профили организаций, и мы постепенно создали около 200 таких профилей, и теперь наиболее "производительные" в научном плане организации России можно найти в Web of Science Core Collection, просто проведя поиск по полю "Organization-Enhanced" ("Профиль Организации" в русскоязычном интерфейсе). К слову, для МГУ им. Ломоносова таких вариантов мы нашли более 430 - это включая варианты с опечатками, да-да, в научных журналах бывает и такое.


В этом посте я постараюсь ответить на все возможные вопросы, связанные с профилем вашей организации.

Как понять, есть ли у нас профиль и как он называется?

Это можно посмотреть в нашем организационном каталоге. Как видите на скриншоте выше, под словом "Organization-Enhanced" есть ссылка "Select from index" ("Выбрать из указателя" в русском интерфейсе).



Там можно посмотреть либо по первой букве, либо при помощи поискового окошка, присутствует ли название вашей организации и как именно оно выглядит (естественно, каждое название профиля мы согласовываем с самой организацией, но для нас важно, чтобы оно было максимально простым, без всяких FGAU VPO). Если из списка результатов нажать на кнопку Add - название профиля будет скопировано в строку поискового запроса, если нажать на D - откроется список найденных нами вариантов названия.

Как создаются профили?


Профили мы делаем на основе поля Address. Смотрите, на картинке выше - один из вариантов написания организационной аффилиации СПБГУ. Наша программа разбивает строку "адрес" на части, чтобы понять: это - название организации, это - структурное подразделение (если оно было указано), это - почтовый адрес, город, индекс, страна и т.д. Это - важно, чтобы затем мы могли вручную доработать привязку к тому или иному профилю, и организация, которая находится на улице Кирова, не попала бы в профиль, например, университета имени Кирова.

Но это - детали, в реальности всё намного проще: чтобы мы могли создать профиль вашей организации, нам нужен список адресов в том виде, в котором вы их видите выше, а также желаемое название объединённого профиля.

Как сделать этот список?

Данные из Web of Science можно экспортировать для обработки в других приложениях, именно это нам сейчас и понадобится. Давайте разберём по шагам:

Делаем поиск по всем вариантам написания названия вашей организации - по полю Address.


На странице результатов поиска, над списком публикаций, есть кнопка экспорта данных Save to... - нажимаем на неё, выбираем "Save to Other File Formats" ("Сохранить в файл другого формата" по-русски).


Далее выбираем, в каком именно формате мы выгружаем данные: выбираем все публикации с первой до n, содержимое записи: "Full Record" ("Полная запись"), формат файла: "Plain Text" ("Обычный текст").


Система сохранит нам список публикаций в текстовом формате. Надо открыть скачанный файл, в нём нажать Ctrl+A, чтобы выделить всё его содержимое, затем - Ctrl+C, чтобы скопировать его в буфер обмена.

Дальше нужно вытянуть текст, содержащий все варианты адресов вашей организации, из этого файла. Вручную это делать довольно долго, и мы сделали макрос в MS Excel, который сам вытянет эти поля и сложит списком их на отдельном листе. Шаблон файла можно скачать отсюда.

Всё, что теперь нужно сделать с полученным списком - это удалить те варианты, которые не относятся к вашей организации, и, как я уже писал, прислать его мне на адрес pavel.kasyanov@clarivate.com. Небольшая просьба: в заголовке письма напишите, пожалуйста "Профиль организации" - тогда эти письма будут попадать в отдельную папку, и я быстрее смогу их обрабатывать.

После этого я сделаю всё остальное, необходимое для того, чтобы профиль у вас появился. Возможно, нам с вами придётся запастись терпением - тысяча профилей вряд ли будет создана за несколько недель, но я буду пытаться сделать всё возможное, чтобы профиль появился как можно быстрее.

Конечно же, если вдруг в будущем вы найдёте новые варианты написания адреса, которые пока не учтены в профиле (или, наоборот, найдёте ошибочно привязанные варианты написания) - можно будет либо прислать мне и их, либо воспользоваться функцией "Suggest a correction" ("Предложите поправку") прямо из записи о публикации с "проблемным" адресом.