Выше квартилей
HSE: Home of Scientometrics and Expertise
Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.
Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: [email protected]
Recent Posts
Публикуйся вновь и вновь: еще несколько слов о publish or perish по данным опросов
Научная политика может оказывать значительное влияние на индивидуальные стратегии публикации ученых. Давление академической культуры «публикуйся или умри» (publish or perish) вынуждает исследователей ориентироваться на формальные критерии оценки публикационной активности.
В Research Evaluation вышло исследование, в котором авторы изучили влияние (субъективно ощущаемого) внешнего давления на мотивацию к публикации и публикационные стратегии ученых. Авторы опирались на данные, собранные ZSoA по результатам онлайн-опроса ученых, работающих в вузах Германии, Австрии и Швейцарии. Выборка составила 11 100 исследователей, среди которых 22,19% — профессора, 39,42% — постдоки и 38,29% — ученые без научной степени.
К основным публикационным стратегиям авторы относят ориентацию исследователей на академическую репутацию, вероятность принятия статьи, скорость публикации, открытый доступ, международную или местную аудиторию.
Они также выделяют следующие общие тенденции в публикациях:
🔹публиковаться стали больше, что влияет на рост коллабораций и развитие недобросовестных практик, таких как «тактика салями» (salami slicing);
🔹сдвиг от монографий и глав в книгах в сторону статей;
🔹рост публикаций на английском языке;
🔹ориентация на импакт-фактор при выборе журнала.
Молодые ученые, не занимающие штатные должности, испытывают более сильное давление, связанное с необходимостью публиковаться, в то время как давление, связанное с получением финансирования, выше в старших возрастных группах и среди тех, кто занимает штатные должности.
Согласно исследованию ученые не придерживаются исключительно какой-либо одной стратегии. Однако репутация журнала, публикация открытого доступа и международная аудитория являются приоритетными критериями при выборе изданий.
Выяснилось также, что чем выше воспринимаемое давление, тем с большей вероятностью исследователи будут фокусироваться на репутации журнала, быстрой публикации и международной специализированной аудитории.
Старшие научные сотрудники реже ориентируются на скорость публикации, в отличие от молодых ученых, и более ориентированы на открытый доступ и местную читательскую аудиторию, а также репутацию журнала, а не импакт-фактор.
Очевидно, что опытные ученые также свободнее в выборе тем публикации, что отразилось в результатах опроса. Молодые исследователи ориентируются на скорость принятия статьи, в связи с чем преимущественно не рискуют публиковать новаторские исследования, которые могут быть не приняты к публикации или негативно отразиться на их карьере.
Основные результаты показывают, что большое количество исследователей придерживаются стратегий публикаций, которые могут оказаться невыигрышными в долгосрочной перспективе. Они сосредотачиваются на отчетах о публикационной активности и публикуются в журналах с высоким рейтингом, т.е. вовлечены в «publication game».
По мнению авторов, возникающий принцип выживания ученых, наиболее адаптированных к формальным критериям, может представлять риск для будущего науки в целом.
#научнаяполитика#обзор#publishorperish#публикационныестратегии
Научная политика может оказывать значительное влияние на индивидуальные стратегии публикации ученых. Давление академической культуры «публикуйся или умри» (publish or perish) вынуждает исследователей ориентироваться на формальные критерии оценки публикационной активности.
В Research Evaluation вышло исследование, в котором авторы изучили влияние (субъективно ощущаемого) внешнего давления на мотивацию к публикации и публикационные стратегии ученых. Авторы опирались на данные, собранные ZSoA по результатам онлайн-опроса ученых, работающих в вузах Германии, Австрии и Швейцарии. Выборка составила 11 100 исследователей, среди которых 22,19% — профессора, 39,42% — постдоки и 38,29% — ученые без научной степени.
К основным публикационным стратегиям авторы относят ориентацию исследователей на академическую репутацию, вероятность принятия статьи, скорость публикации, открытый доступ, международную или местную аудиторию.
Они также выделяют следующие общие тенденции в публикациях:
🔹публиковаться стали больше, что влияет на рост коллабораций и развитие недобросовестных практик, таких как «тактика салями» (salami slicing);
🔹сдвиг от монографий и глав в книгах в сторону статей;
🔹рост публикаций на английском языке;
🔹ориентация на импакт-фактор при выборе журнала.
Молодые ученые, не занимающие штатные должности, испытывают более сильное давление, связанное с необходимостью публиковаться, в то время как давление, связанное с получением финансирования, выше в старших возрастных группах и среди тех, кто занимает штатные должности.
Согласно исследованию ученые не придерживаются исключительно какой-либо одной стратегии. Однако репутация журнала, публикация открытого доступа и международная аудитория являются приоритетными критериями при выборе изданий.
Выяснилось также, что чем выше воспринимаемое давление, тем с большей вероятностью исследователи будут фокусироваться на репутации журнала, быстрой публикации и международной специализированной аудитории.
Старшие научные сотрудники реже ориентируются на скорость публикации, в отличие от молодых ученых, и более ориентированы на открытый доступ и местную читательскую аудиторию, а также репутацию журнала, а не импакт-фактор.
Очевидно, что опытные ученые также свободнее в выборе тем публикации, что отразилось в результатах опроса. Молодые исследователи ориентируются на скорость принятия статьи, в связи с чем преимущественно не рискуют публиковать новаторские исследования, которые могут быть не приняты к публикации или негативно отразиться на их карьере.
Основные результаты показывают, что большое количество исследователей придерживаются стратегий публикаций, которые могут оказаться невыигрышными в долгосрочной перспективе. Они сосредотачиваются на отчетах о публикационной активности и публикуются в журналах с высоким рейтингом, т.е. вовлечены в «publication game».
По мнению авторов, возникающий принцип выживания ученых, наиболее адаптированных к формальным критериям, может представлять риск для будущего науки в целом.
#научнаяполитика#обзор#publishorperish#публикационныестратегии
Дайджест: ноябрь 2024
Представляем дайджест научных событий за последний месяц.
Научные статьи
• Лутц Борнманн, один из членов редколлегии Scientometrics, и Кристиан Лейбель, основываясь на недавних работах, посвященных индексу прорыва (disruptive index), в своем письме описывают скрытые степени свободы в расчете DI1 и других индикаторов.
• Марион Шмидт исследовала, почему некоторые отозванные статьи продолжают цитироваться. Вкратце: предполагается, что в некоторых ситуациях результаты, представленные в отозванных статьях, по-прежнему считаются частью развития конкретной темы исследования.
• Пол Доннер в Journal of Infometrics высказал замечания насчет модифицированного фракционного (долевого) учета.
• Вышла статья, в которой предлагается подробное описание возможной новой метрики — PWI (Prize Winner Index, или индекс лауреатов премий), основанной на числе Эрдёша.
• В Learned Publishing опубликовано исследование специальных выпусков и их роли в научном ландшафте. Отмечается, что публикации в специальном выпуске могут обеспечить более высокие показатели цитирования и возможность зарекомендовать себя в новой области.
Издательская политика
• arXiv сообщил, что в октябре 2024 года в репозиторий поступило в общей сложности 24 226 материалов, что побило предыдущий ежемесячный рекорд июля 2024 года (21 794). Таким образом, общее количество материалов, поданных на arXiv с августа 1991 года по конец октября 2024 года, достигло 2 597 322.
• Web of Science опубликовали список самых цитируемых исследователей 2024 года. В него вошли пятеро российских ученых: двое из Сколково и по одному из МГУ, ТюмГУ и Минздрава.
• Журнал Soft Computing издательства Springer отозвал 330 статей. Большинство отозванных статей были приняты к публикации приглашенными редакторами.
• Журнал eLife все же был исключен из базы данных Web of Science из-за необычной практики журнала публиковать статьи вместе с отзывами рецензентов, при этом не принимая и не отклоняя их. В Scholarly Kitchen обсуждается реакция DORA на эту историю. Вкратце, DORA считает позицию Clarivate устаревшей.
• В Web of Science теперь доступен поиск по идентификатору организации ROR.
Наука и университеты
• В Times Higher Education опубликована заметка о культуре «менеджериализма», которая мешает академической свободе и научному развитию во многих областях.
• В рамках IV Конгресса молодых ученых состоялся круглый стол по теме «Как научному изданию попасть в «Белый список»?» Представители вузов и научных организаций обсудили текущее состояние Белого списка и планы по его развитию.
Новости AI
• Роберт Харрингтон из Американского математического общества размышляет о конфликте между идеалами открытости и напряженным отношением к ИИ, в частности, LLM, которые могут «поглощать» работы, опубликованные под лицензией Creative Commons, без согласия авторов.
• Scholar PDF Reader внедрил AI outline, т.е. детализированное содержание статьи, которое включает маркеры для каждого ключевого раздела. Об этом пишет коллега из канала «Что-то на научном». Маркер позволяет сразу переключиться на нужный фрагмент статьи, минуя просмотр неактуальных для читателя разделов.
• Википедия запустила проект WikiProject AI Cleanup. Задача проекта — поиск и удаление из электронной энциклопедии ложной информации, сгенерированной ИИ.
#дайджест#ИИ#clarivate#белыйсписок
Представляем дайджест научных событий за последний месяц.
Научные статьи
• Лутц Борнманн, один из членов редколлегии Scientometrics, и Кристиан Лейбель, основываясь на недавних работах, посвященных индексу прорыва (disruptive index), в своем письме описывают скрытые степени свободы в расчете DI1 и других индикаторов.
• Марион Шмидт исследовала, почему некоторые отозванные статьи продолжают цитироваться. Вкратце: предполагается, что в некоторых ситуациях результаты, представленные в отозванных статьях, по-прежнему считаются частью развития конкретной темы исследования.
• Пол Доннер в Journal of Infometrics высказал замечания насчет модифицированного фракционного (долевого) учета.
• Вышла статья, в которой предлагается подробное описание возможной новой метрики — PWI (Prize Winner Index, или индекс лауреатов премий), основанной на числе Эрдёша.
• В Learned Publishing опубликовано исследование специальных выпусков и их роли в научном ландшафте. Отмечается, что публикации в специальном выпуске могут обеспечить более высокие показатели цитирования и возможность зарекомендовать себя в новой области.
Издательская политика
• arXiv сообщил, что в октябре 2024 года в репозиторий поступило в общей сложности 24 226 материалов, что побило предыдущий ежемесячный рекорд июля 2024 года (21 794). Таким образом, общее количество материалов, поданных на arXiv с августа 1991 года по конец октября 2024 года, достигло 2 597 322.
• Web of Science опубликовали список самых цитируемых исследователей 2024 года. В него вошли пятеро российских ученых: двое из Сколково и по одному из МГУ, ТюмГУ и Минздрава.
• Журнал Soft Computing издательства Springer отозвал 330 статей. Большинство отозванных статей были приняты к публикации приглашенными редакторами.
• Журнал eLife все же был исключен из базы данных Web of Science из-за необычной практики журнала публиковать статьи вместе с отзывами рецензентов, при этом не принимая и не отклоняя их. В Scholarly Kitchen обсуждается реакция DORA на эту историю. Вкратце, DORA считает позицию Clarivate устаревшей.
• В Web of Science теперь доступен поиск по идентификатору организации ROR.
Наука и университеты
• В Times Higher Education опубликована заметка о культуре «менеджериализма», которая мешает академической свободе и научному развитию во многих областях.
• В рамках IV Конгресса молодых ученых состоялся круглый стол по теме «Как научному изданию попасть в «Белый список»?» Представители вузов и научных организаций обсудили текущее состояние Белого списка и планы по его развитию.
Новости AI
• Роберт Харрингтон из Американского математического общества размышляет о конфликте между идеалами открытости и напряженным отношением к ИИ, в частности, LLM, которые могут «поглощать» работы, опубликованные под лицензией Creative Commons, без согласия авторов.
• Scholar PDF Reader внедрил AI outline, т.е. детализированное содержание статьи, которое включает маркеры для каждого ключевого раздела. Об этом пишет коллега из канала «Что-то на научном». Маркер позволяет сразу переключиться на нужный фрагмент статьи, минуя просмотр неактуальных для читателя разделов.
• Википедия запустила проект WikiProject AI Cleanup. Задача проекта — поиск и удаление из электронной энциклопедии ложной информации, сгенерированной ИИ.
#дайджест#ИИ#clarivate#белыйсписок
О сетях вокруг нас. Интервью с Дарьей Мальцевой (ANR-Lab)
Сегодня у нас необычный формат поста в качестве эксперимента для нас самих и читателей. Мы взяли интервью у Дарьи Мальцевой, заведующей Международной лаборатории прикладного сетевого анализа НИУ ВШЭ, к материалам которой мы не раз обращались в последнее время.
В интервью «Выше квартилей» Дарья рассказала о том, какие направления деятельности для центра являются сегодня приоритетными и каковы траектории развития и планы на будущее. Мы обсудили принципиальные и технические нюансы использования сетевого анализа в науке и наукометрии, популярные приложения, пакеты и базы данных. Переходите по ссылке ниже, чтобы ознакомиться с фрагментами нашей беседы.
#интервью#сетевойанализ#ВШЭ
Сегодня у нас необычный формат поста в качестве эксперимента для нас самих и читателей. Мы взяли интервью у Дарьи Мальцевой, заведующей Международной лаборатории прикладного сетевого анализа НИУ ВШЭ, к материалам которой мы не раз обращались в последнее время.
В интервью «Выше квартилей» Дарья рассказала о том, какие направления деятельности для центра являются сегодня приоритетными и каковы траектории развития и планы на будущее. Мы обсудили принципиальные и технические нюансы использования сетевого анализа в науке и наукометрии, популярные приложения, пакеты и базы данных. Переходите по ссылке ниже, чтобы ознакомиться с фрагментами нашей беседы.
#интервью#сетевойанализ#ВШЭ
Три года «Выше квартилей»🗓 🎆
Дорогие подписчики! Сегодня наш канал празднует свой третий день рождения. Мы традиционно составили подборку из десяти наиболее просматриваемых постов за прошедший год:
1️⃣ Академический угон: обзор публикаций о hijacked журналах
2️⃣ United2Act и борьба с paper mills
3️⃣ Чат-боты: цитировать или не цитировать?
4️⃣ Dark side of publishing
5️⃣ Королевство пустых зеркал
6️⃣ Retracted Articles: от репутационных проблем к аналитике по областям
7️⃣ Репозиторий НЦ на GitHub
8️⃣ Лейденский рейтинг: открытая версия
9️⃣ Les grands embrasements naissent de petites étincelles
1️⃣ 0️⃣ Обновление квартилей JCR
Уже второй год у нас активно выходила тематическая аналитика о нобелевских лауреатах под тегом #нобелевскаянеделя, практически каждую неделю — #обзор на одну из наиболее интересных свежих статей в нашей области и авторская #аналитика по различным библиометрическим базам и инструментам, а ежемесячно — #дайджест самых важных новостей в сфере науки и наукометрии со всего мира. Мы сделали цикл публикаций о недобросовестных исследовательских практиках, вели рубрику #историянаукометрии и неоднократно касались темы этичного использования #ИИ-инструментов в научной работе, а также во второй раз поучаствовали в фестивале науки «Республика ученых» ВШЭ.
Те из наших читателей, кто посещал фестиваль в прошлом году, возможно, помнят нашу наукометрическую викторину. И сегодня, в честь годовщины, мы хотим представить ее всем подписчикам нашего канала. Переходите по ссылке, играйте (с коллегами или друзьями) и делитесь впечатлениями!
Остаемся выше квартилей!
Дорогие подписчики! Сегодня наш канал празднует свой третий день рождения. Мы традиционно составили подборку из десяти наиболее просматриваемых постов за прошедший год:
Уже второй год у нас активно выходила тематическая аналитика о нобелевских лауреатах под тегом #нобелевскаянеделя, практически каждую неделю — #обзор на одну из наиболее интересных свежих статей в нашей области и авторская #аналитика по различным библиометрическим базам и инструментам, а ежемесячно — #дайджест самых важных новостей в сфере науки и наукометрии со всего мира. Мы сделали цикл публикаций о недобросовестных исследовательских практиках, вели рубрику #историянаукометрии и неоднократно касались темы этичного использования #ИИ-инструментов в научной работе, а также во второй раз поучаствовали в фестивале науки «Республика ученых» ВШЭ.
Те из наших читателей, кто посещал фестиваль в прошлом году, возможно, помнят нашу наукометрическую викторину. И сегодня, в честь годовщины, мы хотим представить ее всем подписчикам нашего канала. Переходите по ссылке, играйте (с коллегами или друзьями) и делитесь впечатлениями!
Остаемся выше квартилей!
Оценка социального влияния книг
Наукометрия исторически сталкивается с трудностями при оценке и изучении гуманитарных дисциплин, так как наукометрические индикаторы и метрики были разработаны на основе коммуникативных практик в сфере естественных наук. В связи с этим в последнее время поднимается вопрос о включении индикаторов социального влияния в исследовательские оценки. Например, инициативу активно продвигают AESIS (Network for Advancing and Evaluating the Societal Impact of Science) и Research Excellence Framework, уже включающая такой индикатор в качестве одного из своих критериев оценки.
В социальных и гуманитарных науках (Social Sciences and Humanities) результаты исследований часто представлены в книгах, а не статьях. Привычный анализ цитирования больше подходит для статей, поэтому в качестве альтернативного метода оценки книг применяют libcitation (число библиотек, хранящих данную книгу, согласно национальному или международному сводному каталогу). Такой метод позволяет оценить «интуитивное представление о популярности», т.е. влияние, выходящее за рамки научного.
Недавно исследователи из Бельгии проанализировали книги, написанные учеными, изучающими социальные и гуманитарные науки. В своей работе они уделили основное внимание книжным фондам в публичных и научных библиотеках. Результаты работы опубликованы в Journal of the Association for Information Science and Technology (JASIST).
Для изучения локального влияния книг авторы собрали список ISBN из Фламандской академической библиографической базы данных по общественным и гуманитарным наукам (VABB). На момент сбора данных (2022 год) БД охватывала 240 301 публикаций (с 2000 по 2019 год), из которых 46 641 содержали ISBN. Эти данные впоследствии были сопоставлены с каталогами UniCat (каталог 90 научных библиотек) и Cultuurconnect (каталог 854 фламандских публичных библиотек).
Согласно результатам исследования, большинство книг из выборки хранятся в научных библиотеках (54,7%), а в публичных содержится меньшая часть (18,5%). Почти все книги представлены в печатном формате (94,7%). 51,9% всех книг представлены на английском языке, из них 46% включены в каталоги научных библиотек, а оставшиеся 5% относятся к публичным.
Из полученного массива авторы выделили книги, входящие в топ цитирований (top1percent), т.е. книги, обладающие высокой видимостью и широкой потенциальной аудиторией, и, следовательно, самыми высокими показателями фондов в публичных (69 книг) и научных (255 книг) библиотеках.
Литература в публичных библиотеках почти полностью представлена на нидерландском языке. Высоко оцененные в этом типе библиотек книги нацелены на широкую аудиторию (например, научно-популярная литература). Следует отметить, что только несколько книг набрали высокие баллы libcitation в обоих видах библиотек: словари и справочники, а также 3 книги, написанные популяризаторами науки.
Публичные библиотеки привлекают более разнообразную аудиторию, в отличие от научных библиотек, которые нацелены на представителей академической среды. Таким образом, книги из каталога публичной библиотеки с большей вероятностью окажут прямое социальное или культурное влияние, которое на данном этапе ускользает из поля зрения оценки из-за отсутствия устоявшихся метрик.
#библиотеки#цитирования#libcitation
Наукометрия исторически сталкивается с трудностями при оценке и изучении гуманитарных дисциплин, так как наукометрические индикаторы и метрики были разработаны на основе коммуникативных практик в сфере естественных наук. В связи с этим в последнее время поднимается вопрос о включении индикаторов социального влияния в исследовательские оценки. Например, инициативу активно продвигают AESIS (Network for Advancing and Evaluating the Societal Impact of Science) и Research Excellence Framework, уже включающая такой индикатор в качестве одного из своих критериев оценки.
В социальных и гуманитарных науках (Social Sciences and Humanities) результаты исследований часто представлены в книгах, а не статьях. Привычный анализ цитирования больше подходит для статей, поэтому в качестве альтернативного метода оценки книг применяют libcitation (число библиотек, хранящих данную книгу, согласно национальному или международному сводному каталогу). Такой метод позволяет оценить «интуитивное представление о популярности», т.е. влияние, выходящее за рамки научного.
Недавно исследователи из Бельгии проанализировали книги, написанные учеными, изучающими социальные и гуманитарные науки. В своей работе они уделили основное внимание книжным фондам в публичных и научных библиотеках. Результаты работы опубликованы в Journal of the Association for Information Science and Technology (JASIST).
Для изучения локального влияния книг авторы собрали список ISBN из Фламандской академической библиографической базы данных по общественным и гуманитарным наукам (VABB). На момент сбора данных (2022 год) БД охватывала 240 301 публикаций (с 2000 по 2019 год), из которых 46 641 содержали ISBN. Эти данные впоследствии были сопоставлены с каталогами UniCat (каталог 90 научных библиотек) и Cultuurconnect (каталог 854 фламандских публичных библиотек).
Согласно результатам исследования, большинство книг из выборки хранятся в научных библиотеках (54,7%), а в публичных содержится меньшая часть (18,5%). Почти все книги представлены в печатном формате (94,7%). 51,9% всех книг представлены на английском языке, из них 46% включены в каталоги научных библиотек, а оставшиеся 5% относятся к публичным.
Из полученного массива авторы выделили книги, входящие в топ цитирований (top1percent), т.е. книги, обладающие высокой видимостью и широкой потенциальной аудиторией, и, следовательно, самыми высокими показателями фондов в публичных (69 книг) и научных (255 книг) библиотеках.
Литература в публичных библиотеках почти полностью представлена на нидерландском языке. Высоко оцененные в этом типе библиотек книги нацелены на широкую аудиторию (например, научно-популярная литература). Следует отметить, что только несколько книг набрали высокие баллы libcitation в обоих видах библиотек: словари и справочники, а также 3 книги, написанные популяризаторами науки.
Публичные библиотеки привлекают более разнообразную аудиторию, в отличие от научных библиотек, которые нацелены на представителей академической среды. Таким образом, книги из каталога публичной библиотеки с большей вероятностью окажут прямое социальное или культурное влияние, которое на данном этапе ускользает из поля зрения оценки из-за отсутствия устоявшихся метрик.
#библиотеки#цитирования#libcitation
Dateno: первые опыты
Современная наука во многом построена на больших массивах данных, доступ к которым можно получить через репозитории, однако инструментов, позволяющих осуществлять поиск сразу по нескольким из них не так много. Так, Google Dataset Search выглядит подходящим инструментом, но исследователи, для которых предметом изучения являются сами данные, сталкиваются с ограничениями по автоматизации их получения.
Мы давно обратили внимание на проект Dateno (команда под руководством Ивана Бегтина), о котором упоминали в мартовском дайджесте. На сегодняшний день Dateno содержит информацию о 19 миллионах датасетов, но самое главное - имеет достаточно понятный и удобный API-интерфейс, с которым мы и решили, наконец, попробовать поработать.
Простая инструкция с примером очень хорошо описана в телеграм-канале И. Бегтина: пользователь регистрируется, получает токен, а дальше применение API возможно как напрямую из браузерной строки, так и через консольный инструмент, скрипт Python/R и т.д.
Зарегистрировавшись, мы сразу запросили данные о датасетах, в заголовке которых есть слово "scientometric*". Таких нашлось 92. Всего включено 35 параметров, в том числе данные о самих датасетах (название, ссылка, тематика, описание, формат и др.) и об источниках этих датасетов (название и тип каталога, название и тип его владельца, страна, язык и прочее).
Конкретно по нашей тематике данные размечены не полностью — например, лицензия указана всего для 10 датасетов из 92, тематика — для 16, а макрорегион — для 33. Подавляющее большинство наборов данных (56) принадлежит Европейскому Союзу, а вот в США их всего 17. Самые распространенные форматы .tsv и .txt (по 13). Датасетов в формате .json, к нашему удивлению, всего 2.
В целом, Dateno оказался действительно удобным инструментом, как с точки зрения технической доступности (открытый API есть у немногих репозиториев), так и с точки зрения покрытия данных. Предлагаем поделиться своим опытом использования Dateno в комментариях.
#dateno#датасеты#открытыеданные
Современная наука во многом построена на больших массивах данных, доступ к которым можно получить через репозитории, однако инструментов, позволяющих осуществлять поиск сразу по нескольким из них не так много. Так, Google Dataset Search выглядит подходящим инструментом, но исследователи, для которых предметом изучения являются сами данные, сталкиваются с ограничениями по автоматизации их получения.
Мы давно обратили внимание на проект Dateno (команда под руководством Ивана Бегтина), о котором упоминали в мартовском дайджесте. На сегодняшний день Dateno содержит информацию о 19 миллионах датасетов, но самое главное - имеет достаточно понятный и удобный API-интерфейс, с которым мы и решили, наконец, попробовать поработать.
Простая инструкция с примером очень хорошо описана в телеграм-канале И. Бегтина: пользователь регистрируется, получает токен, а дальше применение API возможно как напрямую из браузерной строки, так и через консольный инструмент, скрипт Python/R и т.д.
Зарегистрировавшись, мы сразу запросили данные о датасетах, в заголовке которых есть слово "scientometric*". Таких нашлось 92. Всего включено 35 параметров, в том числе данные о самих датасетах (название, ссылка, тематика, описание, формат и др.) и об источниках этих датасетов (название и тип каталога, название и тип его владельца, страна, язык и прочее).
Конкретно по нашей тематике данные размечены не полностью — например, лицензия указана всего для 10 датасетов из 92, тематика — для 16, а макрорегион — для 33. Подавляющее большинство наборов данных (56) принадлежит Европейскому Союзу, а вот в США их всего 17. Самые распространенные форматы .tsv и .txt (по 13). Датасетов в формате .json, к нашему удивлению, всего 2.
В целом, Dateno оказался действительно удобным инструментом, как с точки зрения технической доступности (открытый API есть у немногих репозиториев), так и с точки зрения покрытия данных. Предлагаем поделиться своим опытом использования Dateno в комментариях.
#dateno#датасеты#открытыеданные
CoARA vs ISSI: подходы к оценке публикаций
Не так давно, в сентябре, мы уже касались дискуссии о подходе к оценке публикаций: какие факторы следует учитывать при определении ценности научной работы, можно ли полагаться только на объективные количественные критерии или следует каким-то образом принимать во внимание дальнейшее научное и социальное влияние исследование?
Сегодня мы решили чуть больше рассказать об инициативе CoARA и ее критике. CoARA, или Коалиция по развитию оценки исследований, была основана в 2022 г., а в июле того же года был опубликован программный документ: Соглашение о реформировании оценки научных исследований, которое предполагает признание широкого спектра практик, видов деятельности и профессиональных траекторий в научно-исследовательской среде, а также активно продвигает включение качественных контрольных показателей в оценку научной работы одновременно со снижением влияния зависимости от показателей, основанных на количественных метриках. На 15 октября 2024 г. соглашение подписали 796 учреждений, включая государственные и частные университеты, институты и другие организации, которые имеют отношение к научной оценке. После подписания и вступления в Коалицию организация может принять участие в одной или нескольких рабочих группах (всего их 13).
Однако в статье Джованни Абрамо, президента ISSI, инициатива критикуется достаточно подробно. Во-первых, Коалиция была сформирована без участия ISSI (Международного общества наукометрии и инфометрии). Возможно, у учредителей CoARA возникли сомнения в использования количественного подхода со стороны ISSI, однако специалисты по наукометрии хорошо знают, в каких обстоятельствах следует применять метрики, а в каких — использовать экспертную оценку. Основной проблемой являются не сами метрики, а их применение без экспертных навыков.
Впрочем, одна их рабочих групп Коалиции так и называется «Ответственные показатели и индикаторы». Абрамо справедливо отмечает, что «ответственного» отношения мало, чтобы правильно использовать наукометрические инструменты, но, в целом, подходы в этом плане у них похожие.
Во-вторых, CoARA рассматривает рецензирование как основной метод оценки, поэтому сосредотачивается на оценке качества результата. Наукометрические методы, напротив, измеряют последующее влияние (различные показатели, связанные с цитируемостью), которое, разумеется, ни один рецензент предсказать не может. Кроме того, следует учитывать издержки рецензирования. В 2020 году рецензенты по всему миру потратили на рецензирование более 100 миллионов часов (более 10 тысяч лет!), а оценочная стоимость времени составляет $1,5 млрд в США, $600 млн в Китае и $400 млн в Великобритании (Aczel et al.).
Один из самых важных вопросов и наиболее ключевых отличий между позициями CoARA и Абрамо заключается в том, кто должен выбирать методы и индикаторы оценки — эксперты или пользователи? Разработчики политики CoARA выступают за пользователя, однако Абрамо вполне обоснованно на стороне экспертов-профессионалов.
Итак, Абрамо предлагает сохранить в качестве центрального элемента научной оценки количественные методы, применяемые к индексируемым работам, подчеркивая при этом, что у них есть сильные и слабые стороны. В заключении он поднимает другой вопрос: почему так широко распространились сомнения по поводу использования текущих наукометрических показателей? Возможно, это связано с тем, что ключевые идеи наукометрического сообщества игнорируются либо трактуются неверно. И именно в этом ключе следует прилагать дальнейшие усилия.
#обзор#рецензирование#экспертныеоценки#CoARA#ISSI
Не так давно, в сентябре, мы уже касались дискуссии о подходе к оценке публикаций: какие факторы следует учитывать при определении ценности научной работы, можно ли полагаться только на объективные количественные критерии или следует каким-то образом принимать во внимание дальнейшее научное и социальное влияние исследование?
Сегодня мы решили чуть больше рассказать об инициативе CoARA и ее критике. CoARA, или Коалиция по развитию оценки исследований, была основана в 2022 г., а в июле того же года был опубликован программный документ: Соглашение о реформировании оценки научных исследований, которое предполагает признание широкого спектра практик, видов деятельности и профессиональных траекторий в научно-исследовательской среде, а также активно продвигает включение качественных контрольных показателей в оценку научной работы одновременно со снижением влияния зависимости от показателей, основанных на количественных метриках. На 15 октября 2024 г. соглашение подписали 796 учреждений, включая государственные и частные университеты, институты и другие организации, которые имеют отношение к научной оценке. После подписания и вступления в Коалицию организация может принять участие в одной или нескольких рабочих группах (всего их 13).
Однако в статье Джованни Абрамо, президента ISSI, инициатива критикуется достаточно подробно. Во-первых, Коалиция была сформирована без участия ISSI (Международного общества наукометрии и инфометрии). Возможно, у учредителей CoARA возникли сомнения в использования количественного подхода со стороны ISSI, однако специалисты по наукометрии хорошо знают, в каких обстоятельствах следует применять метрики, а в каких — использовать экспертную оценку. Основной проблемой являются не сами метрики, а их применение без экспертных навыков.
Впрочем, одна их рабочих групп Коалиции так и называется «Ответственные показатели и индикаторы». Абрамо справедливо отмечает, что «ответственного» отношения мало, чтобы правильно использовать наукометрические инструменты, но, в целом, подходы в этом плане у них похожие.
Во-вторых, CoARA рассматривает рецензирование как основной метод оценки, поэтому сосредотачивается на оценке качества результата. Наукометрические методы, напротив, измеряют последующее влияние (различные показатели, связанные с цитируемостью), которое, разумеется, ни один рецензент предсказать не может. Кроме того, следует учитывать издержки рецензирования. В 2020 году рецензенты по всему миру потратили на рецензирование более 100 миллионов часов (более 10 тысяч лет!), а оценочная стоимость времени составляет $1,5 млрд в США, $600 млн в Китае и $400 млн в Великобритании (Aczel et al.).
Один из самых важных вопросов и наиболее ключевых отличий между позициями CoARA и Абрамо заключается в том, кто должен выбирать методы и индикаторы оценки — эксперты или пользователи? Разработчики политики CoARA выступают за пользователя, однако Абрамо вполне обоснованно на стороне экспертов-профессионалов.
Итак, Абрамо предлагает сохранить в качестве центрального элемента научной оценки количественные методы, применяемые к индексируемым работам, подчеркивая при этом, что у них есть сильные и слабые стороны. В заключении он поднимает другой вопрос: почему так широко распространились сомнения по поводу использования текущих наукометрических показателей? Возможно, это связано с тем, что ключевые идеи наукометрического сообщества игнорируются либо трактуются неверно. И именно в этом ключе следует прилагать дальнейшие усилия.
#обзор#рецензирование#экспертныеоценки#CoARA#ISSI
Фестиваль науки «Республика ученых»
В доцифровую эпоху переписка заменяла ученым дискуссионную площадку, на которой они делились открытиями, критиковали идеи друг друга и обсуждали новые интеллектуальные течения. Культура научных журналов еще не была развита, поэтому письма (наряду с книгами) были основным источником информации.
Применив метод со-цитирования к письмам, Паоло Россини (Paolo Rossini), постдок Роттердамского университета Эразма, проанализировал сеть связей между крупнейшими учеными XVII века. Результаты опубликованы в Digital Scholarship in the Humanities.
Автор проанализировал переписки крупнейших исследователей, хранящиеся на ePistolarium.
Коллекция базы данных насчитывает более 20 000 писем ученых, которые родились или жили в Республике Соединённых провинций в XVII веке, т.е. в период расцвета и заката Республики ученых.
Используя подход известный как «разграничение полей» (field delineation) в картировании науки Паоло Россини определил группу наиболее часто упоминаемых ученых (30 авторов) и проанализировал их письма (3409 источников с 1623 по 1697 гг.).
Ученые были разделены на две группы: крупнейшие отправители и наиболее часто упоминаемые лица. Согласно результатам, 7 из 10 крупнейших отправителей — математики. Предположительно, это связано с тем, что в тот период математика охватывала несколько дисциплин (квадривиум). Наиболее упоминаемые лица — Рене Декарт (304 упоминания) и Блез Паскаль (228). Самый плодовитый автор в корпусе — Христиан Гюйгенс (1083 письма), для сравнения: за ним следует Декарт, которому принадлежат 280 писем.
Автор разделил анализируемый период на три этапа, что позволило провести продольный анализ интеллектуального ландшафта.
В первом рассматриваемом периоде (1623 – 1644) прослеживаются 3 сообщества:
• «соперники» Декарта;
• «сторонники» Декарта;
• представители гелиоцентрической астрономии.
Т.е. научный дискурс в тот период находился под влиянием Декарта (подъем картезианства) и идей гелиоцентризма. Примечательно, что картезианство приводит к разделению сети, в то время как гелиоцентризм действует как объединяющая сила, предотвращающая ее фрагментацию.
Во втором периоде (1645 – 1665) образовалось 4 сообщества:
• «соперники» и «сторонники» Декарта;
• ученые Лондонского королевского общества;
• две отдельные группы астрономов, разделенные по принципу разрыва поколений.
Во второй половине XVII века картезианство потеряло свое значение. Дискуссии вокруг идей Декарта ограничились группой экспертов, в то время как широкое научное сообщество проявляло интерес к астрономии. Наконец, появление Лондонского королевского общества ознаменовало новый виток в интеллектуальной жизни, характеризующийся приверженностью принципам экспериментальной науки.
Третий период (1666 – 1687) характеризовался сменой ролей в сообществе (см. рис.). Так, Декарт и Галилей, когда-то занимавшие центральное место в отдельных сообществах, стали обладать равным влиянием в одной группе. Астрономы тоже объединились в одну группу, находящуюся под влиянием членства Кассини и Гевелия в престижных научных учреждениях. В то же время появление Французской академии наук и Лондонского королевского общества поляризовало научный дискурс.
Анализ со-цитирования в сочетании с лонгитюдным подходом позволяет получить представление об эволюции научного дискурса и проследить как ученые, которые когда-то определяли идентичность целых сообществ, оказываются «иконами прошлого», как темы дискуссий набирают и теряют популярность, и как важные события формируют интеллектуальный мир и влияют на него.
Кстати, завтра, 8 октября, в Вышке пройдет фестиваль науки «Республика ученых». Площадка мероприятия предоставит возможность пригласить студентов в свои проекты и найти соавторов для исследований. На встрече будут представители факультетов, научных подразделений и студенческих научных объединений. Участниками фестиваля будем и мы, так что ждем всех желающих познакомиться лично!
#Фестивальнауки#Республикаученых#социтирование
В доцифровую эпоху переписка заменяла ученым дискуссионную площадку, на которой они делились открытиями, критиковали идеи друг друга и обсуждали новые интеллектуальные течения. Культура научных журналов еще не была развита, поэтому письма (наряду с книгами) были основным источником информации.
Применив метод со-цитирования к письмам, Паоло Россини (Paolo Rossini), постдок Роттердамского университета Эразма, проанализировал сеть связей между крупнейшими учеными XVII века. Результаты опубликованы в Digital Scholarship in the Humanities.
Автор проанализировал переписки крупнейших исследователей, хранящиеся на ePistolarium.
Коллекция базы данных насчитывает более 20 000 писем ученых, которые родились или жили в Республике Соединённых провинций в XVII веке, т.е. в период расцвета и заката Республики ученых.
Используя подход известный как «разграничение полей» (field delineation) в картировании науки Паоло Россини определил группу наиболее часто упоминаемых ученых (30 авторов) и проанализировал их письма (3409 источников с 1623 по 1697 гг.).
Ученые были разделены на две группы: крупнейшие отправители и наиболее часто упоминаемые лица. Согласно результатам, 7 из 10 крупнейших отправителей — математики. Предположительно, это связано с тем, что в тот период математика охватывала несколько дисциплин (квадривиум). Наиболее упоминаемые лица — Рене Декарт (304 упоминания) и Блез Паскаль (228). Самый плодовитый автор в корпусе — Христиан Гюйгенс (1083 письма), для сравнения: за ним следует Декарт, которому принадлежат 280 писем.
Автор разделил анализируемый период на три этапа, что позволило провести продольный анализ интеллектуального ландшафта.
В первом рассматриваемом периоде (1623 – 1644) прослеживаются 3 сообщества:
• «соперники» Декарта;
• «сторонники» Декарта;
• представители гелиоцентрической астрономии.
Т.е. научный дискурс в тот период находился под влиянием Декарта (подъем картезианства) и идей гелиоцентризма. Примечательно, что картезианство приводит к разделению сети, в то время как гелиоцентризм действует как объединяющая сила, предотвращающая ее фрагментацию.
Во втором периоде (1645 – 1665) образовалось 4 сообщества:
• «соперники» и «сторонники» Декарта;
• ученые Лондонского королевского общества;
• две отдельные группы астрономов, разделенные по принципу разрыва поколений.
Во второй половине XVII века картезианство потеряло свое значение. Дискуссии вокруг идей Декарта ограничились группой экспертов, в то время как широкое научное сообщество проявляло интерес к астрономии. Наконец, появление Лондонского королевского общества ознаменовало новый виток в интеллектуальной жизни, характеризующийся приверженностью принципам экспериментальной науки.
Третий период (1666 – 1687) характеризовался сменой ролей в сообществе (см. рис.). Так, Декарт и Галилей, когда-то занимавшие центральное место в отдельных сообществах, стали обладать равным влиянием в одной группе. Астрономы тоже объединились в одну группу, находящуюся под влиянием членства Кассини и Гевелия в престижных научных учреждениях. В то же время появление Французской академии наук и Лондонского королевского общества поляризовало научный дискурс.
Анализ со-цитирования в сочетании с лонгитюдным подходом позволяет получить представление об эволюции научного дискурса и проследить как ученые, которые когда-то определяли идентичность целых сообществ, оказываются «иконами прошлого», как темы дискуссий набирают и теряют популярность, и как важные события формируют интеллектуальный мир и влияют на него.
Кстати, завтра, 8 октября, в Вышке пройдет фестиваль науки «Республика ученых». Площадка мероприятия предоставит возможность пригласить студентов в свои проекты и найти соавторов для исследований. На встрече будут представители факультетов, научных подразделений и студенческих научных объединений. Участниками фестиваля будем и мы, так что ждем всех желающих познакомиться лично!
#Фестивальнауки#Республикаученых#социтирование
Оценка экономической ценности открытого доступа: взгляд пользователей
Общественное мнение относительно преимуществ и недостатков открытого доступа к исследовательским данным нередко балансирует между полярными точками зрения. С одной стороны, инвестиции в открытый доступ могут восприниматься как напрасные расходы, а сама дискуссия о его важности может смещать фокус с поддержки исследований на развитие инфраструктуры для распространения научного знания. С другой стороны, поддержка открытого доступа воспринимается многими как естественный способ ускорения научного прогресса, что в свою очередь влияет на реализацию различных проектов и повышает ценность таких инвестиций. Именно поэтому в последнее время интерес к оценке открытого доступа расширяется не только с точки зрения наукометрического анализа, но и с позиции измерения экономического эффекта отдачи.
Исследователи из Оксфордского центра биомедицинских исследований и Национальной научной библиотекой Китая, в недавно опубликованной в Research Evaluationработе выяснили, как сами потребители открытого доступа (обычные пользователи, не издательства и компании) оценивают его экономическую пользу.
Опираясь на метод условной оценки (Contingent Valuation Method), ученые проанализировали пользовательские стратегии взаимодействия с бесплатной платформой открытых данных Национального центра данных фундаментальной науки (NBSDC, Китай).
Результаты опроса (всего 322 участника) помогли прояснить пользовательскую вовлеченность в среду БД на разных уровнях (цели и частота посещений, значимость площадки). Все опрашиваемые так или иначе были вовлечены в академическую сферу и занимались исследованиями и/или преподаванием, большинство (74 %) было связано с научно-исследовательскими учреждениями, остальные — с университетами.
В общей сложности 85 % респондентов указали, что экономическая выгода, создаваемая для них платформой, является «значимой» или «очень значимой», 12 % оценили её как «нейтральную», а 1 % как «низкую».
Перейдя к измерениям экономической «стоимости» платформы открытого доступа, исследователи определили, что основные возможные источники ее ценообразования (т.е. то, за что пользователь может потенциально заплатить) — это:
•просмотры (чтение статей, посещение сайта);
•запросы доступа;
•загрузки;
•периодическая подписка (ежемесячная и ежегодная).
Пользователям было предложено оценить эти критерии как со стороны предоставляемой личной экономической выгоды, так и со стороны готовности за эту выгоду платить.
Согласно результатам, наиболее ценным для пользователей оказались просмотры (33 %), затем загрузка данных (16 %) и запросы к ним (13 %). Кроме того, предпочтение было отдано годовой подписке (25 %), а не ежемесячной (14 %). Однако когда речь зашла о реальной готовности платить за использование данных, на первое место вышли загрузки (27 %), а не просмотры (15 %) и запросы (11 %), а вот отношение к годовой (36 %) и ежемесячной (11 %) подпискам приблизительно соответствовало первоначальной оценке ценности подобного вида доступа.
На основе ответов авторы определили стоимость за просмотр, загрузку, запрос и подписку на данные. Исходя из общего количества просмотров на площадке (по состоянию на 2023 год — 33 млн), стоимость NBSDC составила около 165 млн юаней (более 23 млн долларов), а готовность пользователей платить — порядка 66 млн юаней (9 млн долларов).
Таким образом, пользовательское желание платить оказалось приблизительно в 2,5 раза ниже, чем пользовательская оценка значимости открытого доступа. Тем не менее полученный результат, по мнению авторов, является важным аргументом в пользу дальнейшего развития открытого доступа и непосредственно влияет на реализацию стратегий научной политики. Открытый доступ обладает не только неосязаемой научной, но и существенной экономической ценностью, что может послужить дальнейшим стимулом для его поддержки и развития во многих странах, включая Россию.
#OpenAccess#Открытыеданные#обзор#экономическаяоценкаданных
Общественное мнение относительно преимуществ и недостатков открытого доступа к исследовательским данным нередко балансирует между полярными точками зрения. С одной стороны, инвестиции в открытый доступ могут восприниматься как напрасные расходы, а сама дискуссия о его важности может смещать фокус с поддержки исследований на развитие инфраструктуры для распространения научного знания. С другой стороны, поддержка открытого доступа воспринимается многими как естественный способ ускорения научного прогресса, что в свою очередь влияет на реализацию различных проектов и повышает ценность таких инвестиций. Именно поэтому в последнее время интерес к оценке открытого доступа расширяется не только с точки зрения наукометрического анализа, но и с позиции измерения экономического эффекта отдачи.
Исследователи из Оксфордского центра биомедицинских исследований и Национальной научной библиотекой Китая, в недавно опубликованной в Research Evaluationработе выяснили, как сами потребители открытого доступа (обычные пользователи, не издательства и компании) оценивают его экономическую пользу.
Опираясь на метод условной оценки (Contingent Valuation Method), ученые проанализировали пользовательские стратегии взаимодействия с бесплатной платформой открытых данных Национального центра данных фундаментальной науки (NBSDC, Китай).
Результаты опроса (всего 322 участника) помогли прояснить пользовательскую вовлеченность в среду БД на разных уровнях (цели и частота посещений, значимость площадки). Все опрашиваемые так или иначе были вовлечены в академическую сферу и занимались исследованиями и/или преподаванием, большинство (74 %) было связано с научно-исследовательскими учреждениями, остальные — с университетами.
В общей сложности 85 % респондентов указали, что экономическая выгода, создаваемая для них платформой, является «значимой» или «очень значимой», 12 % оценили её как «нейтральную», а 1 % как «низкую».
Перейдя к измерениям экономической «стоимости» платформы открытого доступа, исследователи определили, что основные возможные источники ее ценообразования (т.е. то, за что пользователь может потенциально заплатить) — это:
•просмотры (чтение статей, посещение сайта);
•запросы доступа;
•загрузки;
•периодическая подписка (ежемесячная и ежегодная).
Пользователям было предложено оценить эти критерии как со стороны предоставляемой личной экономической выгоды, так и со стороны готовности за эту выгоду платить.
Согласно результатам, наиболее ценным для пользователей оказались просмотры (33 %), затем загрузка данных (16 %) и запросы к ним (13 %). Кроме того, предпочтение было отдано годовой подписке (25 %), а не ежемесячной (14 %). Однако когда речь зашла о реальной готовности платить за использование данных, на первое место вышли загрузки (27 %), а не просмотры (15 %) и запросы (11 %), а вот отношение к годовой (36 %) и ежемесячной (11 %) подпискам приблизительно соответствовало первоначальной оценке ценности подобного вида доступа.
На основе ответов авторы определили стоимость за просмотр, загрузку, запрос и подписку на данные. Исходя из общего количества просмотров на площадке (по состоянию на 2023 год — 33 млн), стоимость NBSDC составила около 165 млн юаней (более 23 млн долларов), а готовность пользователей платить — порядка 66 млн юаней (9 млн долларов).
Таким образом, пользовательское желание платить оказалось приблизительно в 2,5 раза ниже, чем пользовательская оценка значимости открытого доступа. Тем не менее полученный результат, по мнению авторов, является важным аргументом в пользу дальнейшего развития открытого доступа и непосредственно влияет на реализацию стратегий научной политики. Открытый доступ обладает не только неосязаемой научной, но и существенной экономической ценностью, что может послужить дальнейшим стимулом для его поддержки и развития во многих странах, включая Россию.
#OpenAccess#Открытыеданные#обзор#экономическаяоценкаданных
Дайджест: октябрь 2024
Представляем дайджест научных событий за последний месяц.
Новости AI
• В блоге LSE вышла заметка о незащищенности Google Scholar от растущего количества публикаций, созданных с помощью ИИ. Авторы призывают к использованию альтернатив: The Lens, Matilda и, конечно же, OpenAlex.
• Там же анонсировали и Prolific — платформу для поддержки исследовательских интервью, проводимых при помощи больших языковых моделей (LLM). Интересно будет оценить влияние инструмента на увеличение числа качественных исследований, ожидаем рост библиометрических исследований в этой области.
• Google представил невидимый «водяной знак» для текстов, сгенерированных ИИ. Надеемся, что подобные инициативы помогут быстрее выявлять автоматически сгенерированный текст и в научных публикациях.
Нобелевская неделя
• Подведены итоги Нобелевской недели 2024 года, о которой мы много писали. Особенное внимание привлекли Нобелевская премия по физике, присужденная за пионерские исследования искусственного интеллекта, а также Нобелевская премия по химии, врученная за разработку алгоритма машинного обучения для предсказания строения белков.
• В этому году Citation Laureates от Clarivate удалось предсказать 8 лауреатов Нобелевской премии.
Научные мероприятия
• Более 100 мероприятий, объединенных идеей открытого доступа и темой «Сообщество выше коммерциализации», прошли в рамках ежегодной недели Международного открытого доступа 2024.
• Программный комитет ежегодного собрания Общества научных публикаций (SSP) анонсировал тему встречи 2025 года: «Переосмысление будущего научных публикаций на стыке стоимости и ценностей». Прием заявок открыт до 4 ноября.
• Сегодня также состоится доклад о конфликте интересов между авторами статей и их редакторами. На массиве из полумиллиона публикаций исследователю удалось проследить, как конфликт интересов влияет на публикационные стратегии журналов. Успеть зарегистрироваться можно по ссылке
Издательская политика
• Silverchair приобрел у Clarivate набор продуктов под брендом ScholarOne, которые рассчитаны на помощь издателям в подготовке статей к публикации. Сделка подтверждает, что сейчас Clarivate ориентируется на сотрудничество с академическими и государственными учреждениям, а не издательствами.
• В Science вышла заметка о неоднозначной оценке усилий Plan S по обеспечению открытого доступа.
Научная этика
• В конце прошлого месяца в Web of Science заявили о приостановке индексации мегажурналов Cureus и Heliyon, из-за опасений насчет качества публикуемых статей.
• А совсем недавно WoS приостановил индексацию новых материалов из журнала eLife, ссылаясь на необычную практику журнала публиковать статьи вместе с отзывами рецензентов, при этом не принимая и не отклоняя их.
• Коллеги с Факультета экономических наук отмечают, что в Nature вышла заметка об инструменте Argos от компании Scitility, который определяет потенциально недобросовестные исследования. К началу октября Argos отметил более 40 000 публикаций как статьи «с высоким риском» и 180 000 — «со средним риском».
Рейтинги и базы
• Издание Times Higher Education опубликовало рейтинг World University Rankings 2025. В рейтинг вошло 2092 вуза из 115 стран, из которых 81 — российский, однако ни один из них не вошел в топ-100.
• CWTS Leiden опубликовал рейтинг университетов мира Leiden Ranking Open Edition 2024. По числу работ в топ 10% наиболее цитируемых первое место у МГУ, а второе — у Вышки.
• Глава RAEX высказался о необходимости создания рейтинга университетов стран БРИКС как альтернативы QS и THE. Кстати, такой пилотный рейтинг был опубликован в рамках проекта «Три миссии университета».
• Министр В. Фальков рассказал об инициативе по созданию единой наукометрической базы данных для стран БРИКС. Пока неясно, чем данная инициатива будет принципиально отличаться от схожих идей, активно продвигаемых в последнее время, и существующих открытых баз данных.
#дайджест #новости #базыданных #наукавроссии #редакторскаяполитика #искуственныйинтеллект
Представляем дайджест научных событий за последний месяц.
Новости AI
• В блоге LSE вышла заметка о незащищенности Google Scholar от растущего количества публикаций, созданных с помощью ИИ. Авторы призывают к использованию альтернатив: The Lens, Matilda и, конечно же, OpenAlex.
• Там же анонсировали и Prolific — платформу для поддержки исследовательских интервью, проводимых при помощи больших языковых моделей (LLM). Интересно будет оценить влияние инструмента на увеличение числа качественных исследований, ожидаем рост библиометрических исследований в этой области.
• Google представил невидимый «водяной знак» для текстов, сгенерированных ИИ. Надеемся, что подобные инициативы помогут быстрее выявлять автоматически сгенерированный текст и в научных публикациях.
Нобелевская неделя
• Подведены итоги Нобелевской недели 2024 года, о которой мы много писали. Особенное внимание привлекли Нобелевская премия по физике, присужденная за пионерские исследования искусственного интеллекта, а также Нобелевская премия по химии, врученная за разработку алгоритма машинного обучения для предсказания строения белков.
• В этому году Citation Laureates от Clarivate удалось предсказать 8 лауреатов Нобелевской премии.
Научные мероприятия
• Более 100 мероприятий, объединенных идеей открытого доступа и темой «Сообщество выше коммерциализации», прошли в рамках ежегодной недели Международного открытого доступа 2024.
• Программный комитет ежегодного собрания Общества научных публикаций (SSP) анонсировал тему встречи 2025 года: «Переосмысление будущего научных публикаций на стыке стоимости и ценностей». Прием заявок открыт до 4 ноября.
• Сегодня также состоится доклад о конфликте интересов между авторами статей и их редакторами. На массиве из полумиллиона публикаций исследователю удалось проследить, как конфликт интересов влияет на публикационные стратегии журналов. Успеть зарегистрироваться можно по ссылке
Издательская политика
• Silverchair приобрел у Clarivate набор продуктов под брендом ScholarOne, которые рассчитаны на помощь издателям в подготовке статей к публикации. Сделка подтверждает, что сейчас Clarivate ориентируется на сотрудничество с академическими и государственными учреждениям, а не издательствами.
• В Science вышла заметка о неоднозначной оценке усилий Plan S по обеспечению открытого доступа.
Научная этика
• В конце прошлого месяца в Web of Science заявили о приостановке индексации мегажурналов Cureus и Heliyon, из-за опасений насчет качества публикуемых статей.
• А совсем недавно WoS приостановил индексацию новых материалов из журнала eLife, ссылаясь на необычную практику журнала публиковать статьи вместе с отзывами рецензентов, при этом не принимая и не отклоняя их.
• Коллеги с Факультета экономических наук отмечают, что в Nature вышла заметка об инструменте Argos от компании Scitility, который определяет потенциально недобросовестные исследования. К началу октября Argos отметил более 40 000 публикаций как статьи «с высоким риском» и 180 000 — «со средним риском».
Рейтинги и базы
• Издание Times Higher Education опубликовало рейтинг World University Rankings 2025. В рейтинг вошло 2092 вуза из 115 стран, из которых 81 — российский, однако ни один из них не вошел в топ-100.
• CWTS Leiden опубликовал рейтинг университетов мира Leiden Ranking Open Edition 2024. По числу работ в топ 10% наиболее цитируемых первое место у МГУ, а второе — у Вышки.
• Глава RAEX высказался о необходимости создания рейтинга университетов стран БРИКС как альтернативы QS и THE. Кстати, такой пилотный рейтинг был опубликован в рамках проекта «Три миссии университета».
• Министр В. Фальков рассказал об инициативе по созданию единой наукометрической базы данных для стран БРИКС. Пока неясно, чем данная инициатива будет принципиально отличаться от схожих идей, активно продвигаемых в последнее время, и существующих открытых баз данных.
#дайджест #новости #базыданных #наукавроссии #редакторскаяполитика #искуственныйинтеллект
Влияет ли Википедия на науку?
Википедия была запущена в 2001 году, и уже по состоянию на 2023 год включала в себя более 55 миллионов статей примерно на 300 языках с охватом 400 млн уникальных посетителей в месяц.
В академической сфере, как правило, не принято ссылаться на статьи из Википедии в публикуемых работах, так как в отличие от традиционных энциклопедий, материалы в которых тщательно проверены экспертами, информация, опубликованная в Википедии зависит от «мудрости толпы» (wisdom of the crowds). Несмотря на это некоторые исследователи утверждают, что свободная энциклопедия все же имеет заметное влияние на формирование научного ландшафта.
Например, результаты рандомизированного контролируемого испытания, проведенного несколько лет назад, показали, что исследователи предпочитают использовать в своих научных статьях выражения и цитаты, встречаемые на страницах Википедии, т.е. статья в Википедии может влиять на то, как ученые пишут о предмете в своих собственных исследованиях.
Хотя энциклопедии в целом не всегда активно цитируются в научных статьях, результаты анализа цитирований двух краудсорсинговых и двух экспертных энциклопедий (Wikipedia, Britannica, Baidu Baike и Scholarpedia) показали, что Википедия — наиболее цитируемая энциклопедия из представленных. Так, на свободную энциклопедию ссылались в 141 991 документе Scopus (с 2002 по 2020 г.), в то время как на Британскую энциклопедию (Britannica) — в 15 929 (с 2002 по 2020 г.), на Энциклопедию Байду (Baidu Baike) — в 2934 (с 2007 по 2020 г.) и на Scholarpedia — в 8399 (с 2007 по 2020 г.).
Несмотря на то, что Википедия многоязычна, её больше читают и цитируют на английском языке (95 % всех цитирований). Чаще всего ссылаются на Википедию в США (26 % от числа всех упоминаний), далее следуют Китай (12 %), Индия (11 %), Великобритания (6 %) и Германия (4 %).
Также в последнее время растет интерес к Википедии как к объекту исследования. Результаты недавнего анализа научных статей, индексируемых в WoS с 2001 г. по 2021 г., показывают, что количество упоминаний слов 'wikipedia' и 'wiki' в заголовках, аннотациях и ключевых словах статей растет примерно на 10 % в год. А исследования, посвященные Википедии, публикуют такие журналы, как PloS ONE, Journal of the Association for Information Science and Technology, Journal of the Association for Information Science and Technology, IEEE Access и Information Processing and Management.
Кроме того, публикация научной статьи в качестве источника на Википедии значительно повышает видимость исследования, из-за чего издатели (например, Wiley) начали открывать каталоги своих публикаций для проверенных редакторов, что способствует повышению уровня доверия к опубликованной в энциклопедии информации.
Традиционно также обратим внимание и на OpenAlex, целый топик которого посвящен кластеру работ, фокусирующихся на коллаборациях и динамике взаимодействия сообщества в контексте Wiki (более 27 тысяч публикаций с 188 тысячами цитирований). И это не считая работ с указанием аффилиации Wikimedia Foundation.
Википедия пусть и не всегда явно, но все же оказывает влияние на научное поле. Она способствует открытому распространению научного знания и её несомненный вклад заключается в уменьшении неравенства в получении свободного доступа к нему, что особенно существенно в контексте завершающейся Международной недели открытого доступа.
#Wikipedia#Википедия#OpenAlex#Цитирования
Википедия была запущена в 2001 году, и уже по состоянию на 2023 год включала в себя более 55 миллионов статей примерно на 300 языках с охватом 400 млн уникальных посетителей в месяц.
В академической сфере, как правило, не принято ссылаться на статьи из Википедии в публикуемых работах, так как в отличие от традиционных энциклопедий, материалы в которых тщательно проверены экспертами, информация, опубликованная в Википедии зависит от «мудрости толпы» (wisdom of the crowds). Несмотря на это некоторые исследователи утверждают, что свободная энциклопедия все же имеет заметное влияние на формирование научного ландшафта.
Например, результаты рандомизированного контролируемого испытания, проведенного несколько лет назад, показали, что исследователи предпочитают использовать в своих научных статьях выражения и цитаты, встречаемые на страницах Википедии, т.е. статья в Википедии может влиять на то, как ученые пишут о предмете в своих собственных исследованиях.
Хотя энциклопедии в целом не всегда активно цитируются в научных статьях, результаты анализа цитирований двух краудсорсинговых и двух экспертных энциклопедий (Wikipedia, Britannica, Baidu Baike и Scholarpedia) показали, что Википедия — наиболее цитируемая энциклопедия из представленных. Так, на свободную энциклопедию ссылались в 141 991 документе Scopus (с 2002 по 2020 г.), в то время как на Британскую энциклопедию (Britannica) — в 15 929 (с 2002 по 2020 г.), на Энциклопедию Байду (Baidu Baike) — в 2934 (с 2007 по 2020 г.) и на Scholarpedia — в 8399 (с 2007 по 2020 г.).
Несмотря на то, что Википедия многоязычна, её больше читают и цитируют на английском языке (95 % всех цитирований). Чаще всего ссылаются на Википедию в США (26 % от числа всех упоминаний), далее следуют Китай (12 %), Индия (11 %), Великобритания (6 %) и Германия (4 %).
Также в последнее время растет интерес к Википедии как к объекту исследования. Результаты недавнего анализа научных статей, индексируемых в WoS с 2001 г. по 2021 г., показывают, что количество упоминаний слов 'wikipedia' и 'wiki' в заголовках, аннотациях и ключевых словах статей растет примерно на 10 % в год. А исследования, посвященные Википедии, публикуют такие журналы, как PloS ONE, Journal of the Association for Information Science and Technology, Journal of the Association for Information Science and Technology, IEEE Access и Information Processing and Management.
Кроме того, публикация научной статьи в качестве источника на Википедии значительно повышает видимость исследования, из-за чего издатели (например, Wiley) начали открывать каталоги своих публикаций для проверенных редакторов, что способствует повышению уровня доверия к опубликованной в энциклопедии информации.
Традиционно также обратим внимание и на OpenAlex, целый топик которого посвящен кластеру работ, фокусирующихся на коллаборациях и динамике взаимодействия сообщества в контексте Wiki (более 27 тысяч публикаций с 188 тысячами цитирований). И это не считая работ с указанием аффилиации Wikimedia Foundation.
Википедия пусть и не всегда явно, но все же оказывает влияние на научное поле. Она способствует открытому распространению научного знания и её несомненный вклад заключается в уменьшении неравенства в получении свободного доступа к нему, что особенно существенно в контексте завершающейся Международной недели открытого доступа.
#Wikipedia#Википедия#OpenAlex#Цитирования
Оценка влияния внедрения ИИ в науку
Быстрое развитие искусственного интеллекта (ИИ) затрагивает практически все сферы. Неудивительно, что применение ИИ всё чаще встречается в науке, о чем свидетельствует неумолимо растущее (особенно с 2015 года) количество упоминаний терминов этой сферы в заголовках и аннотациях статей. На днях в Nature Human Behaviour вышла статья, авторы которой подвергли количественной оценке использование и потенциальные преимущества ИИ в научных исследованиях.
Исследователи из Северо-Западного университета (Northwestern University) сопоставили данные более 74 миллионов публикаций с 1960 по 2019 год из Microsoft Academic Graph, охватывающих 19 дисциплин и 292 области, с данными о чуть более 7 миллионах патентов, выданных в период с 1976 по 2019 год Ведомством по патентным и товарным знакам США (USPTO), что позволило проанализировать практическое применение ИИ в научных исследованиях. Также авторы проанализировали встречаемость терминов ИИ в заголовках и аннотациях статей.
Основные результаты работы сводятся к следующему:
• упоминание ИИ в статьях повышает их цитируемость как внутри своей области, так и за ее пределами;
• почти каждая дисциплина включает в себя некоторые области, которые видят потенциал в применении ИИ (см. рис.);
• междисциплинарное сотрудничество способствует стремительному развитию использования ИИ в науке;
• есть разрыв между применением ИИ и обучением ИИ (спрос превышает предложение);
• ИИ может усугубить существующее неравенство в науке (например, демографическое и гендерное).
Искусственный интеллект как открывает новые исследовательские пути, так и является источником неразрешимых проблем, например, этических. Цифровизация и внедрение инструментов ИИ в науку вынуждают трансформировать и переосмыслять традиционные академические форматы, ресурсы и практики.
Кстати, завтра, 23 октября в 16:00, Центр научной интеграции НИУ ВШЭ проведет вебинар с элементами тренинга «Ученый в эпоху перемен: ключевые навыки для построения академической карьеры», на котором среди прочего будет затронута тема влияния глобальных изменений последних 5 лет на деятельность ученого, а также будет поднят вопрос развития необходимых навыков для построения академической карьеры в нестабильное время.
Формат вебинара предполагает взаимодействие. В рамках тренинга будет возможность познакомиться с исследователями из научных и образовательных организаций, а также поделиться своим опытом развития в академической среде. Регистрация доступа по ссылке.
#Искусственныйинтеллект#Центрнаучнойинтеграции
#ИИ#MAG
Быстрое развитие искусственного интеллекта (ИИ) затрагивает практически все сферы. Неудивительно, что применение ИИ всё чаще встречается в науке, о чем свидетельствует неумолимо растущее (особенно с 2015 года) количество упоминаний терминов этой сферы в заголовках и аннотациях статей. На днях в Nature Human Behaviour вышла статья, авторы которой подвергли количественной оценке использование и потенциальные преимущества ИИ в научных исследованиях.
Исследователи из Северо-Западного университета (Northwestern University) сопоставили данные более 74 миллионов публикаций с 1960 по 2019 год из Microsoft Academic Graph, охватывающих 19 дисциплин и 292 области, с данными о чуть более 7 миллионах патентов, выданных в период с 1976 по 2019 год Ведомством по патентным и товарным знакам США (USPTO), что позволило проанализировать практическое применение ИИ в научных исследованиях. Также авторы проанализировали встречаемость терминов ИИ в заголовках и аннотациях статей.
Основные результаты работы сводятся к следующему:
• упоминание ИИ в статьях повышает их цитируемость как внутри своей области, так и за ее пределами;
• почти каждая дисциплина включает в себя некоторые области, которые видят потенциал в применении ИИ (см. рис.);
• междисциплинарное сотрудничество способствует стремительному развитию использования ИИ в науке;
• есть разрыв между применением ИИ и обучением ИИ (спрос превышает предложение);
• ИИ может усугубить существующее неравенство в науке (например, демографическое и гендерное).
Искусственный интеллект как открывает новые исследовательские пути, так и является источником неразрешимых проблем, например, этических. Цифровизация и внедрение инструментов ИИ в науку вынуждают трансформировать и переосмыслять традиционные академические форматы, ресурсы и практики.
Кстати, завтра, 23 октября в 16:00, Центр научной интеграции НИУ ВШЭ проведет вебинар с элементами тренинга «Ученый в эпоху перемен: ключевые навыки для построения академической карьеры», на котором среди прочего будет затронута тема влияния глобальных изменений последних 5 лет на деятельность ученого, а также будет поднят вопрос развития необходимых навыков для построения академической карьеры в нестабильное время.
Формат вебинара предполагает взаимодействие. В рамках тренинга будет возможность познакомиться с исследователями из научных и образовательных организаций, а также поделиться своим опытом развития в академической среде. Регистрация доступа по ссылке.
#Искусственныйинтеллект#Центрнаучнойинтеграции
#ИИ#MAG
Международная неделя открытого доступа
Стартует Международная неделя открытого доступа 2024. Более ста мероприятий, объединенных идеей свободного распространения научных знаний, пройдут по всему миру с 21 по 24 октября в очном, онлайн и гибридном форматах. Мероприятие организовано Коалицией академических ресурсов и научных изданий (Scholarly Publishing and Academic Resources Coalition) и Консультативным комитетом Недели открытого доступа.
Ведущая тема этого года — «Сообщество выше коммерциализации» (Community over Commercialization) поддерживает основную идею Международной недели открытого доступа 2023 года. Серия встреч посвящена продвижению разноплановых подходов к открытой науке, отвечающих интересам как академического сообщества, так и широкой общественности. Развитие одной и той же темы второй год подряд подчеркивает острую необходимость плодотворной дискуссии и перехода от намерений к действиям.
В круг обсуждаемых в течение Недели тем входят:
• последствия контроля производства знаний крупными компаниями;
• издержки бизнес-моделей, усугубляющих неравенство;
• использование персональных данных коммерческими платформами;
• воспроизводимость исследований;
• краудсорсинговые данные и Wikimedia;
• внедрение инструментов искусственного интеллекта в науку;
• развитие инфраструктур открытого доступа (серверы препринтов, репозитории и открытые издательские платформы);
• авторское право.
Кстати, серию вебинаров «7 шагов к открытой науке» в рамках Международной недели открытого доступа проведут представители Государственной публичной научно-технической библиотеки Сибирского отделения Российской академии наук. Любой желающий может поучаствовать в обсуждениях и поделиться своим взглядом на преимущества и недостатки открытого доступа.
#OAweek#Неделяоткрытогодоступа#OpenAccess
Стартует Международная неделя открытого доступа 2024. Более ста мероприятий, объединенных идеей свободного распространения научных знаний, пройдут по всему миру с 21 по 24 октября в очном, онлайн и гибридном форматах. Мероприятие организовано Коалицией академических ресурсов и научных изданий (Scholarly Publishing and Academic Resources Coalition) и Консультативным комитетом Недели открытого доступа.
Ведущая тема этого года — «Сообщество выше коммерциализации» (Community over Commercialization) поддерживает основную идею Международной недели открытого доступа 2023 года. Серия встреч посвящена продвижению разноплановых подходов к открытой науке, отвечающих интересам как академического сообщества, так и широкой общественности. Развитие одной и той же темы второй год подряд подчеркивает острую необходимость плодотворной дискуссии и перехода от намерений к действиям.
В круг обсуждаемых в течение Недели тем входят:
• последствия контроля производства знаний крупными компаниями;
• издержки бизнес-моделей, усугубляющих неравенство;
• использование персональных данных коммерческими платформами;
• воспроизводимость исследований;
• краудсорсинговые данные и Wikimedia;
• внедрение инструментов искусственного интеллекта в науку;
• развитие инфраструктур открытого доступа (серверы препринтов, репозитории и открытые издательские платформы);
• авторское право.
Кстати, серию вебинаров «7 шагов к открытой науке» в рамках Международной недели открытого доступа проведут представители Государственной публичной научно-технической библиотеки Сибирского отделения Российской академии наук. Любой желающий может поучаствовать в обсуждениях и поделиться своим взглядом на преимущества и недостатки открытого доступа.
#OAweek#Неделяоткрытогодоступа#OpenAccess
Большие языковые модели в наукометрии, или зачем нам SciBERT
Не все научные публикации одинаковы с точки зрения их влияния на социальную реальность. Нередко показатель цитируемости и импакт-фактор журнала дают нам некоторое представление о том, насколько серьезная работа перед нами, однако даже недавний пример с сетью взаимосвязей между первыми работами, которые цитируют статью Хопфилда о нейронных сетях, показывает, что одной только высокой цитируемости недостаточно: например, работы уже второго «поколения» цитирований получали в разы больше внимания, чем изначальный труд. Кроме того, не секрет, что в отдельных областях большее внимание привлекают обзоры по научным областям: обычно они цитируются довольно активно, поскольку обобщают информацию по какой-либо тематике, но в то же время не каждый обзор представляет из себя что-то большее, чем простое фиксирование текущего положения дел.
В сентябре Scientometrics опубликовали статью китайских исследователей, в которой описывается метод интеллектуального распознавания высококачественных научных работ на основе метасемантических сетей, задействующих deep learning и LLM-технологии. Раньше это было практически нереализуемой задачей: методы оценки научных статей ограничивались качественным (на основе рецензирования) и количественным (на основе библиометрических показателей) подходами. Недостатки этих методов хорошо изучены — в первом случае это проблемы с воспроизводимостью, неполнота знаний у рецензентов и возможный конфликт интересов, а во втором — временной лаг и разная чувствительность показателей, которая неизбежно влияет на финальную оценку.
Авторы предлагают новый подход к определению качества научной статьи как взвешенной суммы импакт-фактора журнала и средневзвешенной цитируемости статьи, где веса определяются методом информационной энтропии, а потом для «высококачественных» и «низкокачественных» работ строится упомянутая метасемантическая сеть на основе известной языковой модели SciBERT (одна из вариаций еще более широко известной модели BERT от Google). Таким образом, в перспективе это позволит измерять качество статей напрямую по их содержанию, без временного лага.
Кстати, еще одну вариацию BERT (SPS-BERT) уже другой исследовательский коллектив использовал для прогнозирования появления прорывных технологий. Согласно их результатам, этот метод позволяет предсказать индекс прорыва (о котором мы писали ранее) точнее, чем все прочие существующие методы. По крайней мере, на наборах данных DBLP и PubMed.
LLM вообще приобретают всё большую популярность в нашей среде. Тот же Scientometrics в сентябре опубликовал call for papers по теме «искусственный интеллект в наукометрии» (подача заявок до 28 февраля 2025 года).
Оставляя в стороне многократно обсуждаемые вопросы этичности использования инструментов ИИ в различных сферах, мы можем сказать, что перспективы их использования в сфере наукометрии скорее радуют. Языковые модели открывают широкий простор для совершенно новых исследований и выводов, а кроме того, предлагают принципиально иные подходы к оценке научных исследований.
#LLM#обзор#SciBERT
Не все научные публикации одинаковы с точки зрения их влияния на социальную реальность. Нередко показатель цитируемости и импакт-фактор журнала дают нам некоторое представление о том, насколько серьезная работа перед нами, однако даже недавний пример с сетью взаимосвязей между первыми работами, которые цитируют статью Хопфилда о нейронных сетях, показывает, что одной только высокой цитируемости недостаточно: например, работы уже второго «поколения» цитирований получали в разы больше внимания, чем изначальный труд. Кроме того, не секрет, что в отдельных областях большее внимание привлекают обзоры по научным областям: обычно они цитируются довольно активно, поскольку обобщают информацию по какой-либо тематике, но в то же время не каждый обзор представляет из себя что-то большее, чем простое фиксирование текущего положения дел.
В сентябре Scientometrics опубликовали статью китайских исследователей, в которой описывается метод интеллектуального распознавания высококачественных научных работ на основе метасемантических сетей, задействующих deep learning и LLM-технологии. Раньше это было практически нереализуемой задачей: методы оценки научных статей ограничивались качественным (на основе рецензирования) и количественным (на основе библиометрических показателей) подходами. Недостатки этих методов хорошо изучены — в первом случае это проблемы с воспроизводимостью, неполнота знаний у рецензентов и возможный конфликт интересов, а во втором — временной лаг и разная чувствительность показателей, которая неизбежно влияет на финальную оценку.
Авторы предлагают новый подход к определению качества научной статьи как взвешенной суммы импакт-фактора журнала и средневзвешенной цитируемости статьи, где веса определяются методом информационной энтропии, а потом для «высококачественных» и «низкокачественных» работ строится упомянутая метасемантическая сеть на основе известной языковой модели SciBERT (одна из вариаций еще более широко известной модели BERT от Google). Таким образом, в перспективе это позволит измерять качество статей напрямую по их содержанию, без временного лага.
Кстати, еще одну вариацию BERT (SPS-BERT) уже другой исследовательский коллектив использовал для прогнозирования появления прорывных технологий. Согласно их результатам, этот метод позволяет предсказать индекс прорыва (о котором мы писали ранее) точнее, чем все прочие существующие методы. По крайней мере, на наборах данных DBLP и PubMed.
LLM вообще приобретают всё большую популярность в нашей среде. Тот же Scientometrics в сентябре опубликовал call for papers по теме «искусственный интеллект в наукометрии» (подача заявок до 28 февраля 2025 года).
Оставляя в стороне многократно обсуждаемые вопросы этичности использования инструментов ИИ в различных сферах, мы можем сказать, что перспективы их использования в сфере наукометрии скорее радуют. Языковые модели открывают широкий простор для совершенно новых исследований и выводов, а кроме того, предлагают принципиально иные подходы к оценке научных исследований.
#LLM#обзор#SciBERT
🏆 Дарон Аджемоглу, Саймон Джонсон и Джеймс А. Робинсон — за исследование того, как формируются институты и как они влияют на благосостояние.
Скоро станет известно имя лауреата Нобелевской премии по экономике. Как вы думаете, кто получит награду?
• Джанет Карри (экономический анализ детского развития) - 6
👍👍👍 17%
• Парта Дасгупта (интеграция природы и её ресурсов в экономику) - 5
👍👍👍 14%
• Паоло Мауро (влияние коррупции на инвестиции и экономический рост) - 7
👍👍👍👍 20%
• Другой ученый (ваш вариант в комментариях) - 17
👍👍👍👍👍👍👍👍 49%
👥 35 человек уже проголосовало.
• Джанет Карри (экономический анализ детского развития) - 6
👍👍👍 17%
• Парта Дасгупта (интеграция природы и её ресурсов в экономику) - 5
👍👍👍 14%
• Паоло Мауро (влияние коррупции на инвестиции и экономический рост) - 7
👍👍👍👍 20%
• Другой ученый (ваш вариант в комментариях) - 17
👍👍👍👍👍👍👍👍 49%
👥 35 человек уже проголосовало.
Нобелевская неделя. День 6: Экономика
Cовсем скоро будет объявлен лауреат Премии по экономике памяти Альфреда Нобеля. Центральный банк Швеции (Sveriges riksbank) учредил премию по случаю своего 300-летия в 1968 году и продолжает финансировать её по сей день. Поскольку ежегодная премия присуждается вслед за Нобелевскими, ее также принято называть Нобелевской премией. В прошлом году лауреатом стала Клаудиа Голдин (Claudia Goldin) — за изучение роли женщин в формировании рынка труда.
В этом году Clarivate приводит список всего из трёх предполагаемых лауреатов: Джанет Карри (Janet Currie) за «новаторский экономический анализ детского развития», Парта Дасгупта (Partha Dasgupta) за «интеграцию природы и её ресурсов в человеческую экономику» и Паоло Мауро (Paolo Mauro) за «эмпирические исследования влияния коррупции на инвестиции и экономический рост».
Александр Краусс (Alexander Krauss), научный сотрудник Лондонской школы экономики и политических наук, в статье, опубликованной в Journal of Economic Behavior & Organization, описал, как и какие работы, удостоенные Нобелевской премии по экономике, оказывают влияние на прорывы в этой области.
Автор обратился к методам описательной статистики и регрессионного анализа для оценки всех 78 открытий, сделанных 92 Нобелевскими лауреатами с 1969 по 2022 гг. Каждое из открытий соотнесено с важнейшей статьей и, соответственно, с одним «центральным» методом, описанным в исследовании.
Важнейшие методы
Методологические прорывы составляют большую долю всех прорывов, отмеченных Нобелевской премией по экономике (около 31 % всех премий или 24 открытия). К основным приемам последних десятилетий можно отнести использование статистических методов (statistics), экономико-математического моделирования (economic modeling), методов экономического анализа (economic analysis) и теоретико-игрового моделирования (game theory analysis) (см. диаграмму).
Уменьшение временного лага
Сокращается временной разрыв между возникновением метода и получением новых результатов на его основе. Более половины всех Нобелевских открытий были сделаны в течение 9 лет после начала использования необходимого метода в практике эмпирического анализа, а начиная с 1975 года — в течение 5 лет.
Эмпирические методы
Некоторые прорывы, сделанные при обращении к экспериментальным методам, таким как рандомизированные контрольные испытания (randomized controlled trial), более растянуты во времени, поскольку они часто десятилетиями применялись в других областях, прежде чем войти в экономику.
Согласно результатам исследования экономика как научная дисциплина все больше сдвигается в сторону развития и использования эмпирических методов, а значит становится все более междисциплинарной, так как зачастую эмпирические методы используются в других областях или же напрямую заимствуются из них.
Кстати, факультет экономических наук НИУ ВШЭ проводит ежегодный конкурс предсказаний лауреатов Нобелевской премии по экономике. Еще можно успеть принять участие в голосовании!
#нобелевскаянеделя#Нобелевскаяпремия#экономика#NobelPrize
Cовсем скоро будет объявлен лауреат Премии по экономике памяти Альфреда Нобеля. Центральный банк Швеции (Sveriges riksbank) учредил премию по случаю своего 300-летия в 1968 году и продолжает финансировать её по сей день. Поскольку ежегодная премия присуждается вслед за Нобелевскими, ее также принято называть Нобелевской премией. В прошлом году лауреатом стала Клаудиа Голдин (Claudia Goldin) — за изучение роли женщин в формировании рынка труда.
В этом году Clarivate приводит список всего из трёх предполагаемых лауреатов: Джанет Карри (Janet Currie) за «новаторский экономический анализ детского развития», Парта Дасгупта (Partha Dasgupta) за «интеграцию природы и её ресурсов в человеческую экономику» и Паоло Мауро (Paolo Mauro) за «эмпирические исследования влияния коррупции на инвестиции и экономический рост».
Александр Краусс (Alexander Krauss), научный сотрудник Лондонской школы экономики и политических наук, в статье, опубликованной в Journal of Economic Behavior & Organization, описал, как и какие работы, удостоенные Нобелевской премии по экономике, оказывают влияние на прорывы в этой области.
Автор обратился к методам описательной статистики и регрессионного анализа для оценки всех 78 открытий, сделанных 92 Нобелевскими лауреатами с 1969 по 2022 гг. Каждое из открытий соотнесено с важнейшей статьей и, соответственно, с одним «центральным» методом, описанным в исследовании.
Важнейшие методы
Методологические прорывы составляют большую долю всех прорывов, отмеченных Нобелевской премией по экономике (около 31 % всех премий или 24 открытия). К основным приемам последних десятилетий можно отнести использование статистических методов (statistics), экономико-математического моделирования (economic modeling), методов экономического анализа (economic analysis) и теоретико-игрового моделирования (game theory analysis) (см. диаграмму).
Уменьшение временного лага
Сокращается временной разрыв между возникновением метода и получением новых результатов на его основе. Более половины всех Нобелевских открытий были сделаны в течение 9 лет после начала использования необходимого метода в практике эмпирического анализа, а начиная с 1975 года — в течение 5 лет.
Эмпирические методы
Некоторые прорывы, сделанные при обращении к экспериментальным методам, таким как рандомизированные контрольные испытания (randomized controlled trial), более растянуты во времени, поскольку они часто десятилетиями применялись в других областях, прежде чем войти в экономику.
Согласно результатам исследования экономика как научная дисциплина все больше сдвигается в сторону развития и использования эмпирических методов, а значит становится все более междисциплинарной, так как зачастую эмпирические методы используются в других областях или же напрямую заимствуются из них.
Кстати, факультет экономических наук НИУ ВШЭ проводит ежегодный конкурс предсказаний лауреатов Нобелевской премии по экономике. Еще можно успеть принять участие в голосовании!
#нобелевскаянеделя#Нобелевскаяпремия#экономика#NobelPrize
Дискуссия недели в картинке недели: оптика OpenAlex
Решение Нобелевского комитета о награждении Джона Дж. Хопфилда и Джеффри Э. Хинтона премией по физике вызвало немало дискуссий, так как работы лауреатов, на первый взгляд, относятся в большей степени к области компьютерных наук, чем к фундаментальной физике. При этом, как заметили наши читатели, с учетом результатов премии по химии было бы странно не отметить Нобелевской премией авторов метода, который позволил совершить открытие мирового уровня. Но насколько верным было решение дать награду именно в отмеченной научной области?
Алексей Хохлов в своей заметке указывает, что «корни того, что мы называем искусственный интеллект, зародились, когда Хопфилд исследовал системы магнетиков методами теоретической физики». Здесь фактически приводится обоснование самого Нобелевского комитета, подробно разъясняющего, почему истоки нейронных сетей и машинного обучения следует искать именно в областях физики.
Мы же решили на дискуссию недели ответить рубрикой «Картинка недели». Так, мы посмотрели, какое количество различных областей науки затронула публикация Дж. Дж. Хопфилда "Neural networks and physical systems with emergent collective computational abilities" (Proceedings of the National Academy of Sciences of the USA, 1982), которую позже цитировал в своих работах Дж. Э. Хинтон, второй лауреат премии. Всего изначальная статья Хопфилда цитируется 17 884 раза. Для того, чтобы построить сеть цитирований с учетом тематик OpenAlex, мы использовали VOSviewer, и вот, что у нас получилось.
Как видно, физика по объему публикаций действительно занимает далеко не первое место, но общий вклад для этой тематической области оказывается значительным. Нейронные сети позволили значительно продвинуться в различных тематических направлениях, включая и отдельные разделы физики, при этом влияние работы на другие области также оказывается велико. Таким образом, общий вклад в науку лауреатов трудно переоценить (особенно учитывая информационный шум вокруг искусственного интеллекта в последние несколько лет) и в действительности не так существенно, по какой «статье» принято решение. Ведь, в конце концов, у Дж. Дж. Хопфилда докторская по физике. Интерактивная версия доступна по ссылке.
#нобелевскаянеделя#физика#VOSviewer#OpenAlex
Решение Нобелевского комитета о награждении Джона Дж. Хопфилда и Джеффри Э. Хинтона премией по физике вызвало немало дискуссий, так как работы лауреатов, на первый взгляд, относятся в большей степени к области компьютерных наук, чем к фундаментальной физике. При этом, как заметили наши читатели, с учетом результатов премии по химии было бы странно не отметить Нобелевской премией авторов метода, который позволил совершить открытие мирового уровня. Но насколько верным было решение дать награду именно в отмеченной научной области?
Алексей Хохлов в своей заметке указывает, что «корни того, что мы называем искусственный интеллект, зародились, когда Хопфилд исследовал системы магнетиков методами теоретической физики». Здесь фактически приводится обоснование самого Нобелевского комитета, подробно разъясняющего, почему истоки нейронных сетей и машинного обучения следует искать именно в областях физики.
Мы же решили на дискуссию недели ответить рубрикой «Картинка недели». Так, мы посмотрели, какое количество различных областей науки затронула публикация Дж. Дж. Хопфилда "Neural networks and physical systems with emergent collective computational abilities" (Proceedings of the National Academy of Sciences of the USA, 1982), которую позже цитировал в своих работах Дж. Э. Хинтон, второй лауреат премии. Всего изначальная статья Хопфилда цитируется 17 884 раза. Для того, чтобы построить сеть цитирований с учетом тематик OpenAlex, мы использовали VOSviewer, и вот, что у нас получилось.
Как видно, физика по объему публикаций действительно занимает далеко не первое место, но общий вклад для этой тематической области оказывается значительным. Нейронные сети позволили значительно продвинуться в различных тематических направлениях, включая и отдельные разделы физики, при этом влияние работы на другие области также оказывается велико. Таким образом, общий вклад в науку лауреатов трудно переоценить (особенно учитывая информационный шум вокруг искусственного интеллекта в последние несколько лет) и в действительности не так существенно, по какой «статье» принято решение. Ведь, в конце концов, у Дж. Дж. Хопфилда докторская по физике. Интерактивная версия доступна по ссылке.
#нобелевскаянеделя#физика#VOSviewer#OpenAlex
Нобелевская галерея
Большая часть нобелевских лауреатов объявлена. В ожидании последней номинации мы хотим немного отвлечься от официальной части и показать несколько онлайн-выставок, посвященных Нобелевской премии и ее лауреатам.
🎨 Фотограф Фолькер Штегер попросил лауреатов Нобелевской премии зарисовать свои открытия цветными карандашами. Фотосерия «Наброски науки» включает портреты лауреатов вместе с их рисунками. Получились очень яркие и трогательные снимки.
🎨Подборка интерактивных панорамных снимков Нобелевских лауреатов в их лабораториях и офисах, с комментариями об их работе. Научные установки поражают воображение (мы приложили одну из фотографий к посту). Совместный проект фотографа Фолькера Штегера и Lindau Nobel Laureate Meetings.
🎨 Каждое лето, начиная с 1951 года, в Линдау, Германия, проводится недельная встреча Нобелевских лауреатов с молодыми учёными. Это уникальный международный форум, на котором обсуждаются научные исследования и устанавливается диалог между различными поколениями и культурами. В галерее представлены кадры, воссоздающие историю встреч в Линдау.
🎨 Фотограф Питер Бэдж поделился серией фотографий Нобелевских лауреатов, которую начал в 2000 году. Он путешествовал по всему миру, чтобы запечатлеть каждого из живущих на данный момент лауреатов — в настоящее время их более 400.
Кроме того, в Nature вышла потрясающий дата-сторителлинг, посвященный статистике по Нобелевским лауреатам. Таких визуализаций довольно много, но Nature действительно создали очень красивый материал.
Поделитесь в комментариях, какая галерея вам понравилась?
#нобелевскаянеделя#инфографика#NobelPrize
Большая часть нобелевских лауреатов объявлена. В ожидании последней номинации мы хотим немного отвлечься от официальной части и показать несколько онлайн-выставок, посвященных Нобелевской премии и ее лауреатам.
🎨 Фотограф Фолькер Штегер попросил лауреатов Нобелевской премии зарисовать свои открытия цветными карандашами. Фотосерия «Наброски науки» включает портреты лауреатов вместе с их рисунками. Получились очень яркие и трогательные снимки.
🎨Подборка интерактивных панорамных снимков Нобелевских лауреатов в их лабораториях и офисах, с комментариями об их работе. Научные установки поражают воображение (мы приложили одну из фотографий к посту). Совместный проект фотографа Фолькера Штегера и Lindau Nobel Laureate Meetings.
🎨 Каждое лето, начиная с 1951 года, в Линдау, Германия, проводится недельная встреча Нобелевских лауреатов с молодыми учёными. Это уникальный международный форум, на котором обсуждаются научные исследования и устанавливается диалог между различными поколениями и культурами. В галерее представлены кадры, воссоздающие историю встреч в Линдау.
🎨 Фотограф Питер Бэдж поделился серией фотографий Нобелевских лауреатов, которую начал в 2000 году. Он путешествовал по всему миру, чтобы запечатлеть каждого из живущих на данный момент лауреатов — в настоящее время их более 400.
Кроме того, в Nature вышла потрясающий дата-сторителлинг, посвященный статистике по Нобелевским лауреатам. Таких визуализаций довольно много, но Nature действительно создали очень красивый материал.
Поделитесь в комментариях, какая галерея вам понравилась?
#нобелевскаянеделя#инфографика#NobelPrize