Friday 6 September 2019

Немного о трендах в искусственном интеллекте


Нас часто спрашивают - ну а раз вы такие умные и умеете оценивать науку, расскажите нам, какие сейчас вообще тренды в научных исследованиях? Вот мы и решили попробовать. Месяц назад я не знал об искусственном интеллекте практически ничего, а вчера мы провели бизнес-завтрак для представителей некоторых российских корпораций, посвящённый тенденциям в области исследований искусственного интеллекта. Делюсь со всеми интересующимися оценкой науки - и персонально для вас, с бо́льшим уклоном в библиометрию, чем было сделано в моём вчерашнем докладе.


Начнём с динамики публикационной активности по теме "искусственный интеллект" (поиск по всем источникам Web of Science Core Collection, относящиеся к предметной области  под названием "Computer Science, Artificial Intelligence"), все картинки увеличиваются при нажатии.

Динамика публикационной активности по предметному направлению "Computer Science, Artificial Intelligence" в мире и в России (значения для России - на вертикальной оси справа)

Интересно, что пика публикационной активности по теме ИИ было целых два: в 2006 году и в 2017, причём, если посмотреть только на российские публикации - то первый пик 2006 года мы как-то пропустили, зато в позапрошлогодний очень даже попали. Да - в 2018 году, по сути, был спад публикационной активности по искусственному интеллекту - что в России, что в мире. И да, мы попробовали поискать для вас восходящие тренды в сокращающейся предметной области. И нашли.

О чём же всё-таки пишут по теме ИИ за последнее время? Мы взяли 2178 высокоцитируемых публикаций по ИИ (напомню, высокоцитируемые  - это те публикации, что были сделаны за последние 10 лет и попали в 1% наиболее цитируемых для своей предметной области и типа документа) и пропустили их через программу VOSviewer, позволяющую визуализировать библиометрические данные в том числе по соупотреблению в публикациях ключевых слов. Получилась вот такая картинка, разбившаяся на 6 достаточно отчётливых кластеров.


Но нам интересна не тематическая группировка ключевых слов, а тенденции в исследованиях, поэтому эти же ключевые слова и взаимосвязи между ними лучше отобразить в VOSviewer вот таким образом, в зависимости от среднего года, к которому относятся те или иные высокоцитируемые публикации. 


И вот какие из самых "недавних" ключевых слов там можно увидеть:


1. Связка слов вокруг термина Aggegation Operator, используемого в нечёткой логике, среди которых наиболее интересное - Multi-Criteria Decision Making. Если совсем просто, то это - раздел математических методов исследования операций, который изучает принятие решений, но не просто на основе большого количества критериев (как можно было бы догадаться из названия), а критериев, противоречащих друг другу. Простейший пример - формирование портфеля ценных бумаг, где управляющего портфелем всегда интересуют бумаги с максимальной доходностью, но с минимальным риском. Проблема тут - в том, что у инструментов с высокой доходностью и риски тоже высокие. Похожие решения, которые нам приходится принимать в повседневной жизни (например, о покупке телефона или выбора места для отпуска), как правило, принимаются нами не на основе математического расчёта каждого из этих параметров, а на основе интуиции, которая часто нас подводит. Исследования же мультикритериального принятия решений в ИИ помогают математически просчитать случаи, в которых биологический мозг уже неспособен принять оптимальное решение. 

Динамика публикационной активности в мире по теме "multi-criteria decision making" - все публикации

Динамика публикационной активности в мире по теме "multi-criteria decision making" - только высокоцитируемые публикации

Обратите внимание, что если всплеск публикационной активности по MCDM в целом достаточно яркий, хотя и близок к линейному, то у высокоцитируемых публикаций всплеск ещё более выдающийся - то есть, недавние исследования по мультикритериальному принятию решений внезапно начали очень активно цитироваться: причём, в работах не только в по искусственному интеллекту.

С одной прорывной областью разобрались. Что дальше?


2. Даже далёкий от темы ИИ человек наверняка слышал о таком термине как глубокое машинное обучение, поэтому обратите внимание на близко связанный с ним термин под названием "свёрточные нейронные сети" (convolutional neural networks). Это тип нейронных сетей, которые предназначены для распознавания образов. Интересно другое - количество патентов на изобретения, связанные со свёрточными нейронными сетями, как мы часто наблюдаем в инновационном процессе, тоже начало расти через год-два после начала взрывного роста активности публикационной - и в прошлом году вышло вперёд (по секрету скажу, что их количество за неполный 2019 год уже перевалило за полный 2018й: но пока только для патентов). Это очень важная связь между наукой и инновациями, для лишнего подтверждения которой мы сейчас собираем примеры из совершенно разных предметных областей: если вы видите всплеск научных исследований по какой-то потенциально коммерциализируемой тематике, через год-два ждите всплеска и патентной активности по ней же.

Сравнение динамики публикационной и патентной активности по теме свёрточных нейронных сетей

3. Теория Демпстера-Шафера. Это - математическая теория, необходимая для вычисления вероятности события, но не простого, вроде подбрасывания монетки, а сложного, вроде победы в спортивном состязании. Исход итогового события зависит от исходов промежуточных событий, каждое из которых имеет свою, отличную от 50%, вероятность. Исследования теории Демпстера-Шафера в искусственном интеллекте и позволяют  с более высокой точностью предсказывать исход таких событий. Интересно, что эту связку терминов мы нашли при анализе высокоцитируемых публикаций не за 10 лет, а за последние 3 года.


В подтверждение "прорывного" характера этой темы - динамика публикационной активности по теме "теория Демпстера-Шафера" в Web of Science Core Collection: тоже ничего  сверхинтересного, если смотреть на общее количество исследований, но почему-то десятки публикаций прошлого года недавно начали очень активно цитироваться.

Динамика публикационной активности по теме теории Демпстера-Шафера: все публикации, содержащие термин "dempster-shafer theory“, "belief function", "uncertainty measure“, "power aggregation operator“ или "dependence assessment" в журналах, относящихся к  предметной области “Computer Science, Artificial Intelligence”, в Web of Science Core Collection

Динамика публикационной активности по теме теории Демпстера-Шафера: только высокоцитируемые публикации, содержащие термин "dempster-shafer theory“, "belief function", "uncertainty measure“, "power aggregation operator“ или "dependence assessment" в журналах, относящихся к  предметной области “Computer Science, Artificial Intelligence”

Теперь давайте посмотрим, что видно у нас в стране. Россия с 9139 публикациями по искусственному интеллекту занимает пока 24е место в мире. 

Ведущие 25 стран мира по публикационной активности по теме исскусственного интеллекта, и их количество публикаций по этой теме за всю историю.

При этом, топ-10 российских организаций по количеству проведённых исследований выглядит так.

Ведущие российские организации по публикационной активности в области искусственного интеллекта

 А вот как цитируются их работы.

Цитируемость их публикаций, нормазизованная по предметной области (область - одна и та же, этим пунктом можно принебречь), году и типу документа

Среднемировой уровень, напомню - единица. Среднероссийский уровень - 0,56.

Нормализованная средняя цитируемость российских и иностранных публикаций в области искусственного интеллекта

Цитируют нас хуже ожидаемого уровня по той же причине, что и в большинстве остальных наук: в области искусственного интеллекта мы также предпочитаем публиковаться в низкоимпактовых журналах.

Процент публикаций по искусственному интеллекту в журналах того или иного квартиля по импакт-фактору

Здесь важно оговориться, что основная масса исследований по ИИ всё же придаётся огласке не в научных журналах, а на конференциях (73% в мире и 63% - когда там присутствует российская аффилиация). Но распределение журналов по квартилям, характерное для всего остального постсоветского пространства, говорит об общей практике публикационной активности, направленной пока, увы, не на максимизацию огласки результатов исследований.

По этой же причине высокоцитируемых публикаций по ИИ с российской аффилиацией всего 4. Вот они и вот их авторы с российской аффилиацией.


Наконец, вот так выглядит топ авторов из России по индексу Хирша их публикаций по искусственному интеллекту (редкий случай, когда индекс Хирша целесообразно использовать, но в таблице я вам всё равно его значение не покажу)