«Мы видим больше креатива вокруг этой области, которого ей не хватало»
Дискуссия об ИИ на зимних «Просветительских днях» РЭШ
5 декабря прошло первое мероприятие зимнего цикла разговоров Российской экономической школы (РЭШ) о влиянии ИИ, переменах на рынке труда, валютном курсе и других вызовах для экономики. С обновлением ChatGPT активизировались споры о внедрении и регулировании алгоритмов. Менеджер канадской DataGPT Дарья Левина, руководитель исследовательской группы чешского университета по ИИ в области биологии Станислав Мазуренко и профессор РЭШ Иван Стельмах обсудили перспективы технологии. «Ъ» публикует текстовую версию дискуссии.
Екатерина Сивякова, автор научно-популярного портала РЭШ GURU: Российская экономическая школа начинает уже третью серию «Просветительских дней» памяти сооснователя школы, выдающегося экономиста Гура Офера. Открываем мы эту серию онлайн-диалогов разговором об искусственном интеллекте (ИИ).
Предлагаю начать с подведения личных итогов. С момента выхода первой версии ChatGPT прошлой осенью минуло чуть больше года. Какое событие в сфере искусственного интеллекта за это время кажется каждому из вас ключевым и каков ваш личный бонус от появления новых инструментов ИИ? Может быть, они как-то повысили вашу продуктивность?
Иван Стельмах, профессор РЭШ, занимается исследованиями на стыке машинного обучения, поведенческой экономики и теории игр: Я не буду говорить про мировой уровень. Я хочу подсветить какие-то события в России, которые мне показались важными. И, наверное, первое — это очевидно — очень круто, что «Яндекс» выпустил свою версию GPT — YandexGPT, и она внедряется в продукты, это очень важно. Мы видим, что мы остаемся конкурентными, несильно отстаем от мирового рынка и имеем ту технологию, которая, мы надеемся, поможет нам поменять наш бизнес и нашу жизнь.
И тут, наверное, более долгосрочная штука такая, стратегическая, тоже произошедшая в России,— это движение, возглавляемое «Тинькофф» и партнерами, по созданию своего университета. Мы видим, что большие компании, которые свой бизнес строят в том числе во многом на технологиях искусственного интеллекта, напрямую идут в образование, строят новые университеты и чувствуют потребность в более быстром обороте интеллектуальном и наличии людей, которые способны этот ИИ развивать здесь, в России. Поэтому это такие глобальные штуки, которые произошли в России и мне кажутся очень важными.
А если говорить про меня и мою личную продуктивность, тут, мне кажется, не про продуктивность: я приобрел себе «Алису» «Яндекса», у меня теперь дома есть станция, не скажу, что она повысила мою продуктивность, мне кажется, скорее, она ее понизила, потому что я больше времени провожу, общаясь с «Алисой» и слушая музыку. Но это реально классный экспириенс, классный опыт, и интересно наблюдать за тем, как технологии из статей и конференций переходят в реальный мир и оказываются у тебя в доме.
— Отличный, мне кажется, итог про то, что bigtech начинает выполнять образовательную функцию, и виртуальный помощник, который в вашу жизнь интегрирован.
Дарья Левина, менеджер по стратегии и операциям канадской DataGPT: Для меня, наверное, ключевым событием вообще в сфере искусственного интеллекта стало то, насколько быстро он оказался способен проникнуть во все процессы, с которыми наша онлайн-индустрия сталкивается. Теперь и нашим программистам программы помогают писать виртуальные помощники, так называемые copilot, и имейлы нашему CEO помогает писать ChatGPT, и данные анализировать помогает наш продукт DataGPT. То есть буквально во всех сферах деятельности, которые так или иначе завязаны на вот эту онлайн-индустрию, оказалось, что теперь виртуальный интеллект используется, и используется активно. И для меня удивительным является именно скорость этого изменения, то, насколько быстро эта технология проникла во все сферы деятельности.
И мой личный бонус — это, конечно, повышение моей личной производительности труда как дата-аналитика, как человека, который работает непосредственно с данными и переводит их в том числе в формат какого-то текстового саммари. Естественно, количество информации, которую можно обработать, используя ИИ, возрастает, наверное, в три-пять раз.
— То есть искусственный интеллект, который проникает в принципе во все процессы, и профессиональные, и личные, и вот масштаб его проникновения в этом году стал еще более заметным.
Дарья Левина: Да, то есть я бы сказала, что скорость изменений беспрецедентная.
Станислав Мазуренко, руководитель исследовательской группы по ИИ в области белковой инженерии Масариков университета (Чехия): Ну у нас в биологии вообще искусственный интеллект довольно давно уже используется, но в таких небольших масштабах. Скорее как небольшие модели, которые натренированы на небольшом объеме данных. Но последние где-то лет десять, наверное, происходит взрывной интерес к этой теме. В основном из-за того, что сейчас доступны новые экспериментальные технологии, которые позволяют собирать тысячи наблюдений в течение пары недель, в то время как 10 или 20 лет назад такой же объем данных люди собирали годами, и некоторые PhD заканчивали, собирая подобные данные.
В моей области инженерии белков самый большой прорыв был примерно пять лет назад, или даже четыре года назад — это предсказание структуры белка. Это была одна из очень больших проблем в структурной биологии, потому что мы знаем очень много последовательностей протеиновых, сейчас у нас есть базы данных с миллионами, сотнями миллионов последовательностей протеиновых, но, если мы хотим знать, что эти протеины делают в человеческом теле, или как мы их можем использовать в разных областях, нам бы хорошо знать структуру. И вот было соревнование, которое началось еще в 1990-е годы, каждые два года многие институты соревновались в предсказывании структуры по последовательности.
В 2018 году дочернее предприятие Google DeepMind вышло, и это был просто качественный скачок в предсказании, но еще далеко от экспериментальной точности. Поэтому все так немножко напряглись, что происходит, начали смотреть больше в сторону ИИ, но сдержанно относительно. А потом, в 2020 году, два года спустя, они выкатили вторую версию, и вторая версия просто дает точность экспериментальную. И это был очень большой шок для всей индустрии, для всех людей, которые занимаются структурной биологией, а это в каждом департаменте биологическом будет подразделение, которое этим занимается.
Конечно, люди пытались это все осознать. И сейчас уже прошло время, люди осознали, мы узнали какие-то преимущества, недостатки. И мое личное преимущество, которое дал искусственный интеллект, заключается в том, что моя группа стала возможной. Потому что, естественно, все больше и больше людей стало смотреть на ИИ: а мы можем его применить в нашей области, например? Вот этим мы и занимаемся в моей группе.
— Мне кажется, я уже слышала про прорывы в области белковой инженерии не только от вас, но и от специалистов, которые работают в других экономических областях и вообще в других областях науки. И у меня, кстати говоря, есть такая гипотеза, что благодаря ИИ непонятные процессы в других областях стали, возможно, более объяснимы и из-за этого стали вызывать больший интерес со стороны специалистов, которые работают с совершенно другим предметом. Как вам кажется?
Станислав Мазуренко: Абсолютно. И, мне кажется, еще искусственный интеллект позволяет делать инструменты доступными, потому что если у вас раньше были какие-то модели или программы, которые требовали очень специализированного знания, то теперь, например, AlphaFold — вы можете получить доступ через Google Colab и просто вставить последовательность вашего протеина через интернет, и в течение нескольких секунд вы получаете структуру. То есть это прям удивительная доступность этого инструмента по сравнению с предыдущими итерациями и инструментами.
— Так как наша дискуссия носит такой обзорный характер, нам нужно подвести итоги года, давайте попробуем поразмышлять о том, что нам этот год принес, что нам ИИ принес в этом году. Как на ваш взгляд исследователя, что в этом году вы узнали об экономике благодаря очередному витку в развитии методов машинного обучения (ML), искусственного интеллекта и что мы узнали благодаря их использованию на практике, то есть когда уже появились use-кейсы, которые мы теперь можем каким-то образом проанализировать? И чего мы еще не знаем, какие вопросы, может быть, ученые уже в этом году сформулировали, но ответов на них пока еще нет?
Иван Стельмах: У меня такой ответ — сразу одним ответом на все три вопроса. Что изменилось с практической точки зрения? На самом деле, теперь все стали AI-экспертам, исследователями и стартаперами. И это реально классно, потому что доступ ко всем технологиям есть у всех, и он очень простой. И я вижу, как люди, которые раньше особенно не программировали, участвуют в хакатонах, где нужно что-то придумать на основе ИИ, потому что в принципе им нужно просто придумать правильный промпт в ChatGPT, красиво это завернуть в презентацию — и вот тебе и хорошее участие в хакатоне. Это реально классно. Мы видим, мне кажется, больше креатива вокруг этой области, которого ей не хватало.
Но здесь же есть и проблема, которую я бы хотел осветить на основе статьи (.pdf), которая вышла в середине года, там изучали вопрос стандартов для машинного обучения. Представим, что нам с вами нужно понять, кто из учеников школы с большей вероятностью из нее отчислится, предсказать такой dropout, кто из студентов не сможет доучиться. Это очень стандартная задача машинного обучения, она решается даже не такими методами, как ChatGPT или AlphaFold, а весьма стандартными. И эту задачу хорошо решили и получили с точки зрения математики и машинного обучения метрик хорошее значение. То есть казалось бы, что мы научились очень классно предсказывать, какой ребенок находится в риске исключения из школы.
Но проблема в том, что, когда это решение применилось на практике, оно практически не понизило уровень отчисления из этой школы. И вот исследователи проанализировали несколько лет данных социоэкономических по этой школе и увидели, что, несмотря на то что классное решение вроде с точки зрения математики и машинного обучения было внедрено, оно не помогло увеличить эффективность школы. И это привело нас к вопросу о том, а как мы правильно используем алгоритмы машинного обучения для решения социальных или экономических проблем и правильно ли мы их вообще ставим.
Потому что, на самом деле, в той конкретной работе, в том конкретном кейсе оказалось, что не так важно решать задачи персонализированного предсказания риска, а задача предсказания риска на уровне города, региона или школы дает точно такую же точность с точки зрения математики. И это подводит нас к главному вопросу, что есть разрыв между типичной задачкой машинного обучения, где мы говорим про гиперперсонализацию, предсказания всего на уровне единого человека, и реально работающими механизмами, которые, на самом деле, требуют куда менее гранулярной оценки. Здесь возникает такой разрыв, и мы видим, что ML очень далеко ушло в решении своей задачи, но не всегда это помогает нам решить практическую задачку.
И это, собственно, приводит к третьей части: какие вопросы остались нерешенными, а вот именно такие — как нам правильно делать трансфер технологий со статей или прикольных демо на реальные задачи бизнеса, экономики или общества, которые не всегда очевидно решаются с помощью технологий. Надеюсь, что в следующем году мы увидим что-то позитивное в этом направлении.
— У меня тоже есть такая гипотеза, что как раз исследователи, те, кто умеет ставить проблему, ставить задачу, профессионально формулировать исследовательский вопрос — research question — может быть, в том числе могут обучать вот этому искусству промпт-инжиниринга как одному из навыков будущего, вот этому языку общения с искусственным интеллектом.
Давайте продолжим разговор о том, что исследователи теперь умеют с помощью ИИ. Станислав, вы руководите командой, которая является частью департамента экспериментальной биологии и занимается машинным обучением, автоматизацией, анализом данных белковой инженерии в области исследования на стыке биохимии, биофизики, информатики и математики. Один из главных таких трендов последнего года, может быть, последних нескольких лет — это то, что все более востребованы специалисты именно с междисциплинарной экспертизой, да, и вы яркий пример такого эксперта. Что исследователи теперь умеют с помощью инструментов машинного обучения, что с их помощью, может быть, стало возможно?
Станислав Мазуренко: С точки зрения фундаментальной области искусственный интеллект обладает очень большим потенциалом в биологии, потому что чаще всего биологические системы очень сложные и взаимосвязанные. То есть как у вас в крове находятся все протеины и они друг с другом взаимодействуют, они также взаимодействуют с вашими метаболитами, с различными молекулами, и это взаимодействие суперсложное. Поэтому очень тяжело классическими методами придумать какой-то набор правил, по которым эти системы взаимодействуют. С другой стороны, ИИ позволяет автоматически смотреть на разные комбинации этих правил, в результате давать какие-то результаты, инструменты, которые люди могут использовать в своем исследовании.
В моей области ИИ используется и помимо предсказаний структур протеинов. Cейчас уже куча моделей есть, которые это делают под разными условиями, в разных сетапах, например, если у вас есть два протеина, которые взаимодействуют, как эта задача будет изменена. Потому что у нас очень много сигнальных функций, например, выполняется каскадами протеинов. Как протеины взаимодействуют с нашими генами, с различными молекулами, которые потенциально могут быть лекарствами. Как протеины взаимодействуют в сети различных реакций в человеческом организме.
В этом году также Deep Mind выпустило AlphaMissense, и это программа, которая позволяет предсказывать в мутациях протеина, сломают они функцию протеина или нет, с какой вероятностью. И это имеет огромный потенциал в здравоохранении. Потому что каждый человек в среднем накапливает довольно-таки большое количество мутаций, несколько десятков, может быть, и, естественно, некоторые из них совершенно безобидные, некоторые могут в результате вызвать какое-то неприятное заболевание. И поэтому наличие такого инструмента, который может предсказывать,— это, конечно, огроменный плюс.
Вообще, биология очень много берет вдохновения со смежных дисциплин, особенно с компьютерного зрения и анализа больших языковых моделей. Потому что многие гены могут быть представлены как последовательность букв или слов. Вот у нас сейчас используется диффузионные модели. Очень часто мы можем взять облако атомов и их диффузировать в какой-нибудь хороший, полезный протеин, который может выполнять какую-то хорошую функцию — вот, например, RFdiffusion недавно был опубликован, и сейчас мы уже даже его в нашей лаборатории используем.
— Представила себя в каком-то мире будущего. Мне кажется, мы сегодня такой форсайт немножко простраиваем про то, как этот мир будет выглядеть дальше. Мы поговорили с вами про исследовательскую часть. Давайте через бизнес-призму посмотрим на возможности искусственного интеллекта.
Дарья, хочу с вами обсудить тоже тренд такой заметный этого года на дата-консалтинг. И мы видим, что если большие технологические компании уже давно занимаются не только внедрением технологий ИИ в свои процессы, но и запускают собственные разработки, делают свои продукты, то бизнес меньшего масштаба, скорее, воспользуется аутсорс-услугами посредников. Компания DataGPT, в которой вы работаете, развивает очень популярное сейчас направление как раз дата-консалтинга, ваш главный продукт — это диалоговый чат-бот для бизнеса, который помогает компаниям анализировать и интерпретировать собственные данные.
С точки зрения представителя бизнеса, который хочет понять, как это вообще выглядит на практике: вот этот бизнес будущего, в каких задачах может помочь виртуальный консультант, с какими запросами к вам приходит бизнес, может быть, какие-то есть результаты, как-то можно их группировать, типологизировать. Как вы помогаете?
Дарья Левина: Я думаю, сейчас основная вообще задача, которая стоит перед индустрией дата-аналитики в целом,— это увеличение доступности данных для пользователей. То есть изначально, когда все это начиналось, собственно дата-аналитика, для того, чтобы разговаривать со своими данными, получать какую-то из них информацию, человеку необходимо было владеть языками программирования. То есть должен был быть SQL и Python. Сейчас есть очень много так называемых BI solutions (инструменты бизнеса-аналитики.— “Ъ”) — это известные Power BI, Tableau и другие инструменты, которые позволяют людям без использования программирования, просто через диалоговое окно, просто через какие-то запросы строить визуализации данных, получать какую-то информацию, какое-то объяснение, почему произошли те или иные изменения. И тот продукт, который мы готовим в нашей компании, это уже следующий этап развития, когда человеку уже даже не надо будет знать, собственно, что он ищет.
С классическими BI solutions нужно знать вопрос, который вы задаете. Допустим, может быть, у вас какая-то гипотеза, вы скажете: а хочу увидеть динамику продаж в разрезе на категории за такой-то период. Потому что вы предполагаете, что продажи у вас упали, потому что упала какая-то категория. У нас продукт немного другой, он состоит из двух частей. Одна часть, она полностью анализирует все изменения в данных и смотрит, какие были основные факторы, которые привели к росту выручки, к падению трафика и т. д. И дальше, соответственно, человеку даже не нужно сформировывать гипотезу. Данные изначально все проанализированы, и человек может просто задать вопрос опять же в простой текстовой форме и получить ответ тоже в текстовой форме. Это уже максимально увеличенная доступность знаний, то есть любой человек, может быть даже не то, что не имеет отношения к дата-аналитике, но даже просто не является особенно техническим, который всю жизнь работает с людьми, не с данными, не с цифрами.
Для любого человека должны быть данные сейчас доступны. И на самом деле, это отвечает большому запросу, который сейчас существует с точки зрения индустрии. Потому что очень много делается вложений вообще в дата-аналитику и в том числе, как и в то, чтобы этих сотрудников нанять в компанию или в какие-то тулы приобрести, но при этом процент организаций, которые могут себя назвать дата-ориентированными, он тем не менее не растет, остается в районе одной четвертой. То есть несмотря на то что делаются вложения, инсайты, которые получены от данных, не всегда можно интегрировать в реальную жизнь. И вот это настоящая проблема, которую наш продукт пытается решить для рынка.
Иван Стельмах: Я правильно понял, что уже можно спросить: «Найди то — не знаю что», и что-нибудь интересное тебе найдется? Или пока еще не так?
Дарья Левина: В принципе пока так. Можно сказать просто: «Почему изменилась выручка?» Почему выручка упала? — и, собственно, да, ответит почему.
— Я сейчас представила себя на месте нашего зрителя—дата-аналитика, который может разволноваться очень сильно. В таком случае порог входа в эту профессию снижается, как, на самом деле, и во многие другие профессии. То есть теперь есть инструменты, которые можно использовать без багажа данных и, соответственно, таким образом войти в профессию?
Дарья Левина: В принципе ИИ снижает порог входа в ту или иную индустрию и вообще доступность знаний. Раньше чтобы что-то понять, нужно было воспользоваться Google или «Яндексом», сформировать запрос, найти информацию. Сейчас можно просто подсоединиться к виртуальному интеллекту и его спросить, а как мне вообще понять, как вот то-то и то-то работает, и он вам либо составит детальный план обучения, что вам нужно делать, либо сам все расскажет в зависимости от того, насколько вопрос является всеобъемлющим.
Это в целом такая общая тенденция: информация стала еще более доступной. Первый большой прорыв в увеличении доступности информации был, когда появился интернет. Вот искусственный интеллект — это следующее такого же уровня изменение в уровне доступа к информации.
По поводу того, насколько это угрожает людям, которые работают в этой индустрии, мне кажется, на самом деле — нет, потому что просто те вещи, которые вы сможете, те вопросы, на которые вы сможете ответить, будут более глубинными и более интересными. Все равно наш продукт, когда вот дает какие-то инсайты, он говорит — выручка, допустим, изменилась, потому что изменился ряд тех или иных параметров. Но уже понять, почему они поменялись, может только человек, который владеет бизнес-контекстом, то есть который понимает, изменения в каких бизнес-процессах стоят за изменениями этих факторов.
И в любом случае, после этого нужно проводить какие-то сложные тесты: смотрим, если мы, допустим, вот один параметр изменим, то как изменится там метрика и т. д. То есть дальше идет следующий этап исследований, более сложный. И обычно людям на это не хватает времени. Но сейчас будет хватать, потому что какие-то более рутинные задачи они выполняют искусственным интеллектом.
Иван Стельмах: Хороший бизнес-аналитик должен сказать, не почему упало, а как исправить. Тут еще есть чем заняться.
— Да, вопрос между прошлым и будущем, то есть понять, почему так было в прошлом и что надо с этим сделать в будущем.
Не могу не задать этот вопрос, поскольку год, прошедший под знаком ChatGPT, заканчивается масштабным скандалом в компании—разработчике чата OpenAI. В ноябре буквально в прямом эфире мы наблюдали за тем, как совет директоров компании сначала уволил главу OpenAI Сэма Альтмана, а после того как Альтман и ключевые сотрудники сказали, что в таком случае они перейдут в Microsoft, который до этого инвестировал в OpenAI, вернул его на первую должность. CNN писал, что в итоге Microsoft и Альтман оказались в выигрыше от конфликта. Альтман продолжит руководить своей компанией с более лояльным советом директоров, поскольку его состав был обновлен после конфликта, а Microsoft получит якобы больший контроль над компанией, в которую уже инвестировал.
Cамой распространенной шуткой во время скандала была такая: мы знали, что OpenAI будет лишать людей работы, но не предполагали, что он начнется с Альтмана. Как этот конфликт может повлиять на развитие индустрии ИИ, к каким последствиям может привести, может быть, с точки зрения уровня конкуренции в этой и так высококонкурентной индустрии?
Иван Стельмах: Мне кажется, искусственный интеллект развивается, а естественная глупость остается на месте, и мы видим такие конфликты в компаниях, у руководителей, которые мы видим в обычных компаниях, которые занимаются чем-то другим, совет директоров начинает ругаться с CEO, отправлять кого-то в отставку. Здесь, наверное, большая политика и большие вопросы, что интересно, за всей этой историей стоит какая-то история безопасности ИИ, и, наверное, это добавляет перчинки. Здорово, что тема всплыла, и мы видим, что у самой компании есть опасения по поводу безопасности и есть большое движение сотрудников к тому, что компании должны более аккуратно относиться к вопросам безопасности, поэтому, я думаю, это даст толчок всей области и стимул нам всем задуматься, как мы эту технологию внедряем бережно, думая об обществе и об ее влиянии.
Но в остальном лично мое мнение, что это не особенно повлияет на конкурентную картину, OpenAI остается лидером, Microsoft тоже остается лидером, и OpenAI для Microsoft дают такую площадку экспериментов, которая большая компания себе позволить не может. Я просто напомню, что сама OpenAI всегда была весьма эксцентричной компанией — когда они выпустили GPT-2, это уже было лет пять назад, анонс сопровождался пресс-релизом, в которой компания говорила, что эта технология настолько мощная, что уже представляет угрозу, и они не хотят ее выдавать наружу, но сейчас GPT-2 может на своем компьютере тренировать любой достаточно продвинутый студент, и мы понимаем, что сама по себе технология GPT-2 не оказалась такой мощной, поэтому продолжаем наблюдать. Это все делает интересной картинку для стороннего наблюдателя, посмотрим, что будет в 2024 году.
— Сэм Альтман пока что вернулся на пост руководителя OpenAI, но мы продолжаем наблюдать за тем, как это все происходит.
Иван Стельмах: Да, и там же говорят, что есть какой-то еще более продвинутый у них алгоритм, над которым сейчас активно ведется работа, и Сэм Альтман его продвигает. Посмотрим, я вот все жду, что моя «Алиса» станет еще умнее и перестанет отправлять меня в «Яндекс» за запросами, а будет выдавать ответы на любые вопросы.
— Как вообще мы можем посчитать финансовую выгоду от внедрения инструментов ИИ в бизнес-процессы? Если исходить из очевидных внешних, понятных показателей, действительно ли внедрение таких технологий выгодно, действительно ли они снижают расходы и повышают доходы?
Дарья Левина: Из моего личного опыта работы с компаниями, естественно, внедрение ИИ и просто мониторинг своих данных в каком-то реальном времени — это всегда положительно сказывается на выручке. В чем интерес компании, которая работает в онлайне,— в том, что у нас очень много данных, которые нам очень легко собрать: гораздо легче собрать данные о пользовательском поведении в онлайн-магазине, нежели в реальном магазине, мы же не можем весь магазин обвешать камерами.
При этом когда мы говорим о мониторинге действий на сайте, по факту это происходит, потому что любое действие, любое ваше движение мышки, вся эта информация записывается и анализируется: сколько вы остановились, допустим, что-то прокручивая, вся эта информация есть, она обезличенная, но она анализируется, чтобы понять, что вас действительно могло заинтересовать и какие есть места в веб-сайте, которые работают не совсем оптимально. И любая такая оптимизация, ее тоже, как правило, очень легко сделать. Это не то же самое, что сменить раскладку товаров в реальном магазине: вам достаточно сделать пару кликов в интерфейсе вашему UI-дизайнеру — и все, после этого у вас это изменение есть.
Поэтому, конечно, даже на основе наших клиентов мы видим, что вот эти возможности быстро отловить какую-то неэффективность и ее поправить действительно приносят большую экономию выручки, и какое-то бездействие, безответственное отношение к мониторингу данных может привести к достаточно большим потерям финансовым. Я не хочу конкретные цифры озвучивать, потому что это очень индивидуально для любой компании, но за год речь идет о миллионах долларов, даже для не очень большой компании.
И опять же я не говорю о более теоретических вещах, как рост выручки оттого, что сделали более персонализированные предложения, или оттого, что вы нашли более эффективный способ повторно привлекать пользователя на вашу платформу. Естественно, способов применения этого очень много, и здесь это правда, даже без ИИ, не так важно, есть он или нет — просто искусственный интеллект вашу скорость реакции повышает: раньше вам нужно было 3 дня, чтобы понять, что случилось, сейчас вам нужно для этого 33 минуты, вот и все.
— При этом методы маркетинговых исследований тоже меняются, потому что использование персональных данных сейчас очень сильно регулируется, поэтому тут тоже много движения в этом направлении, и тоже мы видим, как это все меняется на наших глазах. Несмотря на то что данных больше, просто мы теперь это все анализируем иначе.
Давайте продолжим разговор про барьеры. Дарья затронула вопрос об эффективности, вообще эффективность внедрения любых технологий довольно сильно зависит от того, насколько они совместимы с существующими системами и процессами. Как, с одной стороны, сделать этот переход более эффективным и корректно посчитать затраты на него, сформировать стратегию этого перехода? Потому что исследования показывают, что обычно на первых этапах внедрения новых технологий может снижаться эффективность, пока все привыкнут, пока это все интегрируется и так далее. И, с другой стороны, как сделать подобного рода переходы плавными и комфортными для сотрудников? Для людей, которые работают с этими технологиями.
Станислав Мазуренко: Я могу ответить с точки зрения академии. Мне кажется, академия в этом плане немного в выигрышной позиции находится по двум причинам: во-первых, свободное распространение знаний и моделей, поэтому нет необходимости разрабатывать какую-то модель у себя с нуля — можно просто взять опубликованную модель уже, которая обычно опубликована со всеми кодами и инструкциями, как ее установить, и довольно-таки за короткое время попробовать ее у себя в своей лаборатории, будет ли она работать, работает ли, легко ли ее имплементировать. Это обычно у моих студентов может занять пару дней, поиграться с моделью, попробовать ее в наших процессах, в наших задачах и оценить потенциал. И дальше если мы видим, что есть большой потенциал, то мы можем инвестировать больше времени и усилий на то, чтобы эту модель как-то адаптировать под себя. То есть это одна компонента, которая дает преимущество академии.
И вторая компонента: мне кажется, ученые обычно довольно-таки любопытные люди, и поэтому не нужно тратить очень много времени на убеждение сотрудников, которые ни разу не использовали машинное обучение или ИИ, попробовать, потому что все очень любопытные, все хотят. Если вы видите, что для решения задачи, которую вы раньше решали с помощью какого-то стандартного инструмента за долгое время, теперь есть волшебный инструмент, который делает фокус и вдруг получается, то у вас, как у исследователя настоящего, возникает желание, во-первых, попробовать этот инструмент, а во-вторых, попробовать его сломать, потому что, естественно, вам кажется, что не может быть все так хорошо сделано, и это, естественно, мотивирует внедрение и знакомство с новыми инструментами, потому что нет такого большого барьера, что люди говорят: нет, мы не хотим использовать ИИ в наших задачах.
— Много говорили лет пять назад про геймификацию в образовании, может быть, ИИ добавляет геймификацию в бизнес-процессы?
Иван Стельмах: Я как раз про геймификацию вспомнил, что «Яндекс» не только сделал YandexGPT, он же еще сделал учебник по информатике, который позволяет готовиться к ЕГЭ с помощью ассистента, который анализирует ответы, дает подсказки — это как раз та геймификация образования, которая пришла через ИИ и дает нам еще больше инструментов.
И мне понравилось про любопытство ученых — классная штука, но я вспомнил контраргумент, когда мне пришлось несколько лет назад проводить эксперимент, где был небольшой опрос людей: мне пришлось потратить много бумаги и времени, убеждая комитет по этике университета дать разрешение на проведение совсем безобидного эксперимента. Поэтому ученые сами по себе, может быть, и любознательные, но иногда бывают преграды.
— Любопытство объединяет, кстати говоря, ученых, исследователей и журналистов. Дарья, может быть, на основании собственного опыта вы могли бы поделиться, как сделать этот технологический переход для бизнеса внутри плавным и комфортным для людей? Что вы видите, как вообще осваивают ИИ бизнесы?
Дарья Левина: Мне вообще кажется, что часто очень изменения для людей не являются комфортными, потому что люди в целом консервативные создания. Когда мы говорим особенно про изменение какой-то технологии, у вас есть предыдущая технология, в которой вы хорошо знаете, вы вложили много сил в то, чтобы ее выучить, в то, чтобы она для ваших конкретных задач хорошо работала. И к вам приходит какой-то человек и говорит: бросай все, что ты делал раньше, это нам больше не нужно, теперь у нас есть новый инструмент, он даст вам ответы на все ваши вопросы. Естественно, это не очень приятно психологически.
И единственное, что мы можем предложить в ответ,— это какую-то мгновенную ценность, есть такое понятие «immediate value». То есть человек должен моментально увидеть ценность в продукте, и мы это решаем при помощи персонификации нашего предложения: у каждого конкретного бизнес-пользователя есть определенный круг вопросов, который ему интересен, и он ответы именно на эти вопросы находит в первую очередь.
— Четко ли клиенты формулируют свои запросы или вы помогаете эти запросы им сформулировать, чтобы понять, чем эти инструменты могут им помочь?
Дарья Левина: На самом деле, нет, нечетко клиенты формулируют свой запрос — это зависит от компании: кто-то очень хорошо знает и вопросы, и какие ответы они на это ожидают получить, кто-то в принципе даже не понимает, какие метрики они хотят отслеживать. И здесь наша роль как консультанта, как людей, а не искусственного интеллекта,— понять, какой конкретно существует бизнес-запрос. Пока ИИ не научился с этим справляться, это делает наша команда.
— Завершая разговор про барьеры, хочу еще про один из них поговорить. В октябре было опубликовано исследование ассоциации «Финтех»: опросили специалистов, которые работают в финансовом секторе. И ключевым барьером при внедрении технологии ИИ в одной из самых продвинутых с этой точки зрения областей они назвали дефицит профильных специалистов. 83% компаний, которые были опрошены, отметили, что испытывают кадровый голод: им не хватает дата-сайентистов, дата-инженеров, дата-аналитиков.
Крупные финансовые компании уже очень активно внедряют эти технологии — они есть у 95% компаний, но при этом у 53%, то есть больше чем у половины из них, нет стратегии по развитию ИИ. Это локальный пример индустрии, в которой использование ИИ уже очень заметно, но насколько универсальны эти барьеры, есть ли у разных индустрий своя специфика? Если это универсальные барьеры, то можно было бы найти какое-то универсальное решение?
Cтанислав Мазуренко: Мне кажется, что барьеры есть универсальные и есть специфические для каждой области. В моей области я вижу точно такой же недостаток профессионалов, у которых есть бэкграунд как в информатике, например, в каких-то вычислительных методах, так и бэкграунд при знакомстве с данными. Потому что машинное обучение и ИИ — это по определению интердисциплинарные методы, где нужно не только качественно знать, как натренировать модель, но вот как Дарья упоминала, нужно понимать, откуда данные происходят, и нужно понимать, что мы хотим сделать.
Очень часто на конференциях, когда я рекламирую ИИ и какие-то методы машинного обучения, ко мне подходят люди, которые работают в лаборатории только с экспериментами, и говорят: о, это так здорово, вот у нас есть такие данные, что мы с ними можем сделать. Что очень здоровский вопрос, но он требует очень большой инвестиции в понимание, а что вы хотите из этих данных извлечь. И тут уже я не смогу со своей колокольни помочь, потому что я не работал с этими данными.
С другой стороны, мне кажется, в академии большой проблемой является то, что данные довольно-таки сложные. И не совсем понятно, как тренировать людей, потому что и вычислительные методы, программирование требуют какого-то количества курсов, и, например, биология тоже требует какого-то количества курсов, которые должны быть включены в программу — заканчиваются часы, доступные для внедрения каких-то технологий более продвинутых.
И я бы отметил барьер, который более специфичный для моей области,— это валидация моделей. Потому что если мы возьмем языковые модели или модели, которые генерируют изображение, чаще всего в момент тренировки таких моделей или имплементации у себя вы можете довольно-таки быстро проверить, хорошо они работают или нет. Потому что вот они сгенерировали какой-то текст, вот вы с ChatGPT, например, пообщались, вы видите этот текст, он несет какой-то смысл, или там какая-то тарабарщина и вообще ничего не понятно.
А если мы внедряем такие модели для генерирования протеинов — вот вам модель сгенерировала последовательность протеинов, вы не можете, просто посмотрев на нее, сказать: что-то здесь не так, будет плохо работать. Скорее всего, вам придется пойти в лабораторию и потратить очень много недель на то, чтобы это протестировать. И мне кажется, это очень большой барьер, потому что резко вдруг люди понимают: ну, хорошо, у меня были там классические инструменты, которые я использовал, и там была какая-то вероятность успеха не очень суперская, но мне нужно идти в лабораторию и тестировать. Теперь вы мне даете такой искусственный интеллект и обещаете много всего, но мне точно так же придется идти в лабораторию и опять это все протестировать. То есть не совсем понятно, в чем преимущество использования ИИ.
— То есть может быть такой разрыв между ожиданиями и реальностью, которые в этом случае могут не совпадать. Мы очень подробно говорили о регулировании на летних «Просветительских днях», когда обсуждали экономический эффект ИИ, но, для того чтобы подвести итог, не могу об этом тоже не спросить.
Мы видим, что масштаб внедрения технологии ИИ зависит в том числе от оценки рисков этого перехода, и в этом году мы очень много говорили о регулировании систем, созданных с помощью ИИ, обсуждался очень много соответствующий акт Евросоюза — AI Act так называемый, Конгресс США проводил совещание с американских бигтехом. Смысл этих дискуссий сводился к тому, что нужно обеспечить безопасность этих технологий для человека. А как ученые изучают влияние алгоритмов на социальное взаимодействие? И что им все-таки удалось выяснить в этом году?
Иван Стельмах: Я начну со своего примера. Небольшое упражнение тем, кто нас слушает: можно попробовать ввести в Google слово «работакула» — это сочетание двух слов, «работа» и «акула», они склеиваются по букве «А», ничего особого не значат, но по этому запросу вы найдете меня. И это меня очень удивило, мой друг это каким-то образом нашел и мне об этом сказал, что по запросу «работакула» в Google выйду я.
Почему так получилось? Потому что на моем компьютере в какой-то момент была такая наклейка, с этой наклейкой я пришел на День открытых дверей РЭШ, меня сфотографировал фотограф и выложил эту фотографию на сайт. Алгоритмы Google распарсили фотографию, нашли вот крошечную наклеечку, поняли, что там написано «работакула», и стали ассоциировать мою фотографию и людей, сидящих со мной, с этим словом. Дальше вопрос, хочу ли я с ней ассоциироваться или не хочу. И работакула меня, конечно, не оскорбляет. Но там могло быть написано любое другое сочетание букв, может быть, менее приятное, с которым бы я тоже стал ассоциироваться.
И этот мой личный такой кейс на удивление близко похож на тему еще одной научной работы, о которой я хотел бы сегодня рассказать. В этой работе ученые исследуют устойчивость алгоритмов к коллективным действиям людей. Представим, что мы с вами объединились и решили что-то сделать. Решили сделать так, чтобы LinkedIn нас выводил как суперэкспертов в области. И вот ребята поисследовали эту область, поизучали, какие алгоритмы используются внутри продвинутых систем рекомендаций. Оказалось, что на удивление малой группы людей достаточно, чтобы на них существенно повлиять. Если мы с вами в наше резюме добавим скрытый символ, которого нет ни у кого другого, и пролайкаем наше с вами резюме, то с большой вероятностью мы окажемся в топе по запросам экспертов или суперкрутых профессионалов. То есть мы видим, что алгоритмы машинного обучения искусственного интеллекта часто оказываются очень неустойчивыми — как в моем случае с работакулой, так и в случае с этим исследованием и темой рекомендаций.
Это выводит нас к важной задаче: где мы хотим использовать алгоритм машинного обучения ИИ, а где — не хотим. Потому что в нашей жизни есть какие-то правила, которые установлены очень строго. Например, нельзя покупать сигареты и алкоголь до 18 лет. Понятно, что, вообще говоря, в 18 лет все люди разные, кто-то биологически уже старше, кто-то еще младше, и влияние алкоголя на разных людей в возрасте 18 лет разное. И, кажется, машинное обучение — это та штука, которая может этот порог сделать персонализированным, для каждого его посчитать правильно. Но на самом деле мы видим, что, возможно, это не очень хорошая идея, и есть уже иллюстрации на вот таких кейсах, как у меня.
И встает вопрос: а где, собственно, та граница, где мы хотим использовать очень продвинутую персонализацию ИИ, а где хотим жить со старыми добрыми правилами, в которых мы уверены и которые нельзя очень просто обойти? И вопрос движения здесь есть, вопрос поставлен, но не скажу, что есть ответ. Поэтому снова мы смотрим вперед, и, я думаю, в будущем хорошо было бы узнать, как эту границу нащупать правильно и как сделать систему, которая хорошо интегрируется в общество и помогает нам стать лучше, а не хуже.
— Когда мы говорим про рынок труда, тут очень много тревог по поводу того, что многие профессии, многие процессы будут автоматизированы. Но у некоторых из выходивших в этом году исследований рынка труда было одно общее свойство — это коррекция прогнозов по поводу влияния ИИ на рынок труда. И Всемирный экономический форум, и ОЭСР скорректировали свои предыдущие оценки по тому, как ИИ будет автоматизировать процессы, причем в сторону понижения. То есть они говорили, что будет вот столько-то много, а стали говорить, что, нет, все-таки мы пересмотрели, будет меньше.
Насколько вообще сегодня работают привычные инструменты бизнес-аналитики по отношению к ИИ? Каким образом можно спрогнозировать его влияние на рынок труда?
Рынок труда — эволюция или революция
Онлайн-дискуссия в рамках «Просветительских дней» РЭШ
Дарья Левина: Мне кажется, на данном этапе по крайней мере в индустрии дата-аналитики я не вижу больших изменений рынка труда, которые были бы связаны с внедрением ИИ. Из своего личного опыта работы с ИИ, это такой стажер, который к вам пришел, он очень исполнительный, но он не знает, что ему нужно делать. И вот ему нужно все объяснить. Вам его нужно хорошенько обучить и желательно максимально просто, прозрачно, четенько ему изложить, что нужно делать, и вот тогда он может. А потом ваши немножко запросы поменяются, и он опять не может, а вам опять его нужно обучать.
Поэтому мне кажется, что на данном этапе сильно ваше поведение на рынке труда не должно поменяться от внедрения искусственных технологий. Все, что вы можете сделать,— это их использовать в своем обучении, чтобы его сделать более организованным. Ну и опять же для входа в рынок аналитики, дата-аналитики, я по-прежнему рекомендую учить классические какие-то приложения вроде Power BI, Tableau, Qlik для визуализации данных просто, и для вас это будет в любом случае хороший старт. После этого в принципе на это все освоить ИИ уже тоже не очень сложно.
— «Как быстро происходит деградация экспертизы, специалистов через подмену истины алгоритмами ИИ?» Смысл вопроса здесь, я думаю, в актуализации этой экспертизы, насколько быстро она будет терять свою актуальность благодаря развитию новых технологий.
Дарья Левина: Опять же, экспертиза никогда не теряет свою актуальность, потому что есть все равно какой-то органический процесс развития индустрии, и дальше ваши навыки должны этому же процессу как бы следовать. Вот все начали использовать, все перешли от SQL к инструментам бизнес-аналитики, к Power BI и Tableau пресловутому — вам тоже нужно Tableau учить. Все стали в ChatGPT что-то делать — вот и вам нужно взять курс и посмотреть, какие там есть промпты, как правильно писать промпты для этого ChatGPT, чтобы максимально эффективно его использовать в работе.
В принципе на этом ваша задача заканчивается, потому что вы просто как бы вместе с индустрией движетесь и то, какие у вас навыки существуют, они меняются. И опять же я не считаю, что это деградация экспертизы. Потому что человек не может сейчас прийти с «нуля», выучить только ИИ и быть хорошим аналитиком. Это невозможно. Все равно нужно иметь всю предыдущую базу — и только тогда вы действительно сможете какие-то качественные результаты показывать.
Иван Стельмах: Я просто услышал про подмену истины и хотел сразу порекомендовать Пелевина почитать. Я со своим советом везде. Мне кажется, хорошая книжка последняя — «Путешествие в Элевсин».
— По прогнозам Института статистических исследований экономики знаний ВШЭ, почти две трети детей, поступивших в школу в 2016 году, то есть семь лет назад, будут работать по профессиям, которых еще не существует. И 50% работающих сегодня людей будут нуждаться в переподготовке в 2025 году.
Как вообще учесть влияние новых технологий при планировании и построении карьеры в разных индустриях? Я думаю, что этот вопрос актуален не только для тех, кто учится сейчас в школе, но и, наверное, для тех, кто учится в университете, для молодых специалистов и опытных специалистов, то есть это в целом вопрос, который сегодня всех нас волнует.
Станислав Мазуренко: Совет, который я слышал еще в РЭШ, когда я учился, это было больше десяти лет назад, он уже был актуален тогда, и сейчас он еще больше актуален: научиться быть гибким и вообще отбросить вот эту идею, которую, возможно, поколение наших родителей еще холило и лелеяло, что будет выстроена очень четкая карьера в определенной области. Потому что сейчас мир меняется намного быстрее. И проще всего делать ставку на какие-то навыки, которые вы сможете потом в результате перенести на другую область или на другую технологию, которая уже есть.
И мне кажется, с этой точки зрения даже классическое образование не особо проигрывает, потому что те знания, которые мы получали, например, в РЭШ,— это эконометрика, работа с данными, формулирование гипотез, тестирование этих гипотез, анализ — это все остается актуальным. Никто за вас это делать не будет.
Точно так же остаются актуальными скиллы, которые вы развиваете, готовя какие-то тексты или презентуя какую-то информацию. Умение работать в коллективе. Умение прислушиваться к другим людям, которые вообще из другой области. Я помню, что это было еще актуально до того, как я начал заниматься машинным обучением, и тем более это актуально, когда сейчас у нас есть модели, методы и в том числе эксперты и специалисты, которые взаимодействуют. Вот есть специалисты с биологией, они работают в лаборатории. Есть специалист, который сидит за компьютером и тренирует модели. А есть специалист, который общается с клиентами, например, каких-нибудь биотехнологичных компаний. И теперь всем этим людям надо найти общий язык, научиться друг друга понимать. И это, мне кажется, все еще под силу современному образованию.
— Я правильно слышу, что новые технологические волны неизбежно актуализируют мягкие навыки? То есть новый цифровой мир, мир ИИ все равно еще больше на самом деле актуализирует все, что связано с мягкими навыками: это взаимодействие с другими людьми, умение работать в команде, умение договариваться друг с другом?
Станислав Мазуренко: Да, абсолютно, но мне кажется, что даже и твердые навыки все еще так же актуальны. Потому что то же знание какой-нибудь математики, знание химии, биологии вас выручит, если вы будете работать в направлении, которое этим занимается. То есть это никуда не уйдет. Инструменты поменялись. Возможно, теперь вам нужно будет научиться переключаться с одного инструмента на другой. Но ваши фундаментальные знания, они при вас, и они, мне кажется, все еще остаются довольно-таки хорошим активом.
Иван Стельмах: Мне кажется, просто смещается фокус. Когда-то давно образование было фундаментальным. Все люди изучали все, они были вот такими… философами. А потом перешел фокус к инструментам — в последнее время можно стать программистом, выучив Python, фокус на инструментах. И сейчас мы идем немножко обратно, понимая, что инструменты могут меняться и код можно писать с copilot, но фундаментальное образование, то, что Станислав говорил, критическое мышление, даже какие-то метанавыки, возможность быть гибким, умение учиться становятся важными. И такая модель креативного дженералиста, то есть человека, который ничего не боится, готов подстраиваться и имеет фундаментальные навыки, которые его в любой ситуации поддержат и помогут.
— «Куда сейчас нужно идти учиться, чтобы настраивать ИИ под конкретные задачи,— некий администратор или достаточно будет data science?»
Иван Стельмах: Запрос «настраивать ИИ» сейчас звучит «Как писать запросы в Google». Ну, наверное, мы сейчас не имеем специалистов, которые у нас пишут запросы в Google. Все научились писать запросы в Google, и нормально им пользуются. Поэтому здесь я бы тоже сделал шаг назад и посмотрел на большую картинку, понял, что нравится, и уже отсюда выбирал образование. Фундаментальное образование не теряет актуальности, и я бы о нем задумался.
— Дискуссии, которые ведутся по поводу влияния ИИ на рынок труда, как правило, описывают два магистральных направления автоматизации рынка труда. Первое, что искусственный интеллект автоматизирует отдельные задачи, которые раньше выполнялись человеком с помощью ручного труда и таким образом его разгрузят. Второе, что ИИ сократит целые профессии. На ваш взгляд, все же в какой степени будут автоматизированы именно задачи будущего?
Дарья Левина: Мне кажется, что ИИ рано или поздно войдет во все задачи, с которыми бизнес сталкивается, и это абсолютно нормальный процесс. Как-то к нему подготовиться? Я бы тоже отдельно не стала готовиться к тому, как все это будет оптимизировано. Вот как идут изменения, вот так к ним и приспосабливаться, потому что сейчас скорость изменений, их траекторию достаточно сложно предсказать.
Просто нужно, я бы даже так сказала, не учиться применять ИИ в вашей области, а просто постараться свою эффективность как сотрудника той области, в которой вы работаете, увеличивать. Если вам где-то нужно научиться пользоваться ИИ, формируя туда запросы, естественно, это поможет. Но это совершенно необязательно только это или именно это, это могут быть и какие-то другие навыки, в том числе и мягкие, и твердые, и другие.
Станислав Мазуренко: Я являюсь оптимистом в этом плане. Мне кажется, если вы были специалистом в вашей области и у вас была какая-то конкретная задача, которая сейчас решается ИИ, скорее всего, вы от этого выиграете. Потому что теперь у вас есть этот инструмент, ваше внимание может быть направлено на что-то другое.
В области исследовательской это обычно очень сильное преимущество. Потому что ИИ решает задачи, которые и так были не очень интересны с точки зрения такого утилитарного подхода — я хочу иметь просто такой инструмент. Та же самая модель AlphaFold, которая предсказывает структуру, это очень здорово, что мы сейчас можем предсказывать структуру. Но как исследователя, естественно, меня будут интересовать больше вопросы, а как она это делает, а она это делает хорошо во всех случаях или не во всех случаях, а я могу это как-нибудь еще взломать и как-нибудь поменять. Как только появляется такой инструмент, он обрастает кучей дополнительных вот этих вопросов, которые очень хочется исследовать.
И мне кажется, от этого моя профессия выиграет скорее, потому что будут еще больше востребованы люди, которые будут заниматься этими исследовательскими вопросами. Здесь показательным примером является вот этот шок, который люди испытали в структурной биологии, и, естественно, были разговоры о том, что вот сейчас структурные биологи пойдут на улицу, потому что все, они больше не нужны, AlphaFold их замещает. Но вот мы пока что не видим большого количества структурных биологов, которые остаются на улице, и, по моим сведениям, вроде бы все в порядке в структурной биологийи люди перепрофилировались, поменяли вопросы, на которых они сейчас фокусируются. И, мне кажется, все рады, что есть AlphaFold.
— Очень вдохновляюще звучит с точки зрения будущего. Иван, ваш форсайт, какие задачи нам ИИ поможет решать?
Иван Стельмах: Те задачи, на которые нам хватит креативности его применить, мне кажется, примерно так.
— То есть все-таки все зависит от человека, отличный тезис. В продолжение разговора о виртуальных помощниках и о том, как ИИ вообще меняет нашу жизнь, спрос на каких посредников по внедрению этих инноваций будет расти? Очевидно, что когда появляются новые технологические новинки, то нужно, чтобы кто-то объяснил, как ими пользоваться, тот у кого уже накоплен опыт, какая-то практика по этому поводу. Что это будут за посредники, спрос на кого именно будет расти? И главное, куда уйдут посредники после того, как всех научат и когда интеграция наконец-то произойдет?
Иван Стельмах: Я думаю, будет спрос и есть спрос на уверенных людей, кто приходит в компанию. Кто сейчас, может быть, находится в большой области неуверенности и непонимании, что будет дальше, и, если приходит уверенный консультант, мне кажется, консультанты — это те люди, которые первыми берут какую-то выгоду во всей ситуации. Когда приходит уверенный консультант и говорит: слушайте, вам надо делать так, уже пять компаний сделали так и заработали столько денег — и вы столько же заработаете.
А когда он по всем пройдет и всем эту историю расскажет, уже, я думаю, выйдет новая большая тема, как блокчейн был, сейчас СhatGPT, потом что-то еще, и он по тем же компаниям уже пойдет с новой историей о том, как надо делать, чтобы заработать денег.
Станислав Мазуренко: Точно будут востребованы люди, которые умеют прибираться в данных, которые у вас есть. Потому что это тоже один из шагов, если вы хотите внедрить ИИ, по крайней мере у нас в каком-то проекте, вам нужен человек, который понимает, как данные должны быть организованы. Очень часто, если вы ни разу с этим не взаимодействовали, то у вас небольшой хаос. Данные разбросаны по разным отчетам, нет никаких метаданных, и здесь я вижу большой спрос на специалистов, которые могут организовать их в какую-то минимальную базу данных, а может быть, даже и просто в Excel-файл, в котором все будет согласовано. И, мне кажется, такие специалисты, они останутся нужными, даже когда система будет внедрена.
Например, в моей группе люди занимаются своими исследовательскими вопросами. И если мы приводим человека в группу, который теперь может прибраться в данных и организовать их, то никто не будет брать эти функции в будущем на себя. Потому что у людей остаются другие интересы. Поэтому, скорее всего, такой человек будет нужен и в будущем. И мне кажется, что это перейдет в такой разряд инфраструктуры. Как вот у нас сейчас есть инфраструктурные лаборатории, которые позволяют вам делать какие-то классические стандартные измерения в биологии, точно так же будет подразделение, которое вам помогает организовать данные или организовать доступ к этим данным, или как эти данные могут быть использованы для тренировки.
— Данных меньше-то не станет, после такого как внедрятся новые технологии, а скорее их масштаб только будет увеличиваться, то есть тут вопрос будет в масштабировании как раз этой задачи.
Дарья Левина: В мире аналитики данных основной запрос, который сейчас, наверное, есть,— это помимо того, что Станислав корректно озвучил — в данных нужно прибраться, нужно просто сделать нормальную базу данных компании, что, как правило, уже полдела для того, чтобы сделать какую-то инфраструктуру для аналитики.
Еще очень важно уметь бизнес-запросы переводить в запросы к данным. Потому что не всегда прозрачно то, на какие метрики хочет смотреть компания, какие вопросы она хочет решить при помощи данных, какие должны быть способы эти метрики анализировать, то есть на какие разрезы, в каких плоскостях условно пытаемся мы данные разрезать, что конкретно мы хотим мониторить про своих юзеров. Потому что много данных, и все посмотреть — это просто невозможно. Важно понять, по каким из результатов, которые вы получили из своих данных, можно принять какие-то бизнес-решения, а по каким — нельзя, и которые поэтому являются дополнительным шумом, который вас отвлекает.
Очень важно сейчас какое-то бизнес-чутье, вот этот самый консалтинг, чтобы понять вообще, что компания должна делать, как она должна смотреть на свои данные, какие она после этого может совершить действия, чтобы действительно от дата-аналитики привести к повышению своей выручки. То есть вот этот мостик, для него по-прежнему нужны однозначно посредники, и по крайней мере сейчас ИИ вообще никак не приблизился к решению этой задачи.
— «Кто несет правовую ответственность за результат работы ИИ на всем жизненном цикле бизнес-продукта?» Понятно, что юридические практики в разных странах могут отличаться. Вот приходит посредник, предлагает какое-то внедрение, и кто в итоге за это ответственность несет?
Дарья Левина: По большому счету ответственность несет посредник, в том числе потому, что он, когда приходит в компанию, должен показать, что он готов соответствовать всем требованиям к посредникам. Даже сейчас есть специальный документ практически в любой компании, требования, которые предъявляют к любому своему субподрядчику, это обязательное требование по безопасности персональных данных, безопасности в целом данных, которые они передают посреднику. Это огромный документ, который проходит юридическую проверку со всех сторон, поэтому по крайней мере на уровне бизнес-агентов вопрос ответственности вполне себе решен. Естественно, если вы приходите и приносите какой-то тул, то вы уже как посредник должны отвечать за то, что его можно использовать и он действительно соответствует требованиям компании, в которую вы пришли.
Но, соответственно, вы уже как посредник с этим запросом обращаетесь непосредственно к разработчику, если это ChatGPT, то вы обращаетесь к OpenAI и получаете от них подтверждение, что данные не будут использоваться в обучении модели, поэтому они являются конфиденциальными. В реальной жизни на всех этапах это как-то работает даже без регулирования, потому что штрафы очень большие — никто не хочет их платить.
— Я, конечно, не могу не спросить о том, какую роль университеты, высшая школа могут играть в обучении работников для разных индустрий навыкам в этом случае все-таки твердым, связанным с ИИ. Могут ли университеты помочь заместить дефицит профильных специалистов и в какой модификации, как вам кажется, нуждается экономическое образование, чему учить и как менять процесс обучения?
Иван Стельмах: Я думаю, качественное образование, экономическое и любое другое прежде всего нуждается в масштабировании. У нас есть очень крутые вузы, которые очень хорошо готовят, но очень маленькие. В РЭШ, например, несколько десятков, сотен студентов в год, а это мало. Человеческий капитал, который есть, он куда больше, и куда больше людей поменяли бы свою жизнь, получи они такое же классное образование, как те 100 студентов в РЭШ.
Поэтому, я думаю, запрос не только на изменения внутри, тоже он большой, конечно же, нужно быть современными, соответствовать трендам, может быть, быстрее менять программы, но и на масштабирование наружу. То есть цель сделать так, чтобы хорошее образование получало как можно больше людей, чем получает сейчас.
Станислав Мазуренко: Мне кажется, здесь также две компоненты: одна компонента содержательная, что нужно предлагать больше курсов, направленных на объяснение, как работает ИИ, и внедрять эти курсы не на факультете информатики, а на факультете биологии или химии. Потому что сейчас про ИИ можно уже рассказать на таком уровне, не особо уходя в математику за моделями или в какие-то методы программирования, которые необходимы.
И то, что я пытаюсь сейчас сделать на одном из своих курсов,— это просто обучить биологов и химиков: вот у нас есть такие-то модели, у них такая-то логика за ними, и вот такие-то ограничения или преимущества, которые вы можете извлечь из этого. Это, мне кажется, довольно посильная задача, и, скорее всего, сейчас будет небольшая задержка, потому что эта технология очень новая, современная, естественно, даже учителя должны немного к ней привыкнуть и потом начать уже внедрять ее в свои курсы: а вот у нас еще и методы ИИ.
А вторая компонента — это, мне кажется, перестройка самой функции образования, потому что некоторые процессы, например подготовка бакалаврских дипломов или магистерских дипломов теперь будет по-другому работать, потому что у студентов теперь есть доступ к языковым моделям. И возникает вопрос, который учебная часть должна решить: что мы с этим делаем — мы разрешаем студентам использовать, но говорим, что они должны как-то это указать, например. Либо мы вообще отказываемся от такого формата проверки конечных знаний. И я знаю, что есть некоторые факультеты у нас даже, которые смотрят в этом направлении: а может быть, мы от бакалавров вообще не будем требовать большой письменной работы, потому что сейчас можно использовать ChatGPT-модель.
C другой стороны, это может быть немного преждевременно, потому что даже использованию ChatGPT тоже было бы неплохо студентов обучить или хотя бы показать, как это делается, какие есть подвохи, подводные камни. И возможно, мы можем даже их немного стимулировать задачами: используйте языковые модели, но попробуйте их проанализировать. Мне кажется, вот это интересное направление и динамичное. Мы еще пытаемся нащупать почву, где мы пытаемся совсем исключить использование ИИ, где мы хотим, наоборот, сказать студентам: попробуйте, потому что это нужно и это, скорее всего, останется с нами, а где мы должны быть немного аккуратными и делать кучу дисплеймеров.
— Дискуссия про объем авторского вклада в студенческих работах, конечно, идет весь этот год, и пока что ответов на эти вопросы нет, то есть эти практики везде разные.
Дарья Левина: Я здесь соглашусь с Иваном: вообще функция образования сейчас немножко поменялась. Исходя из личного опыта, для меня всегда было самым ценным в образовании, которое я получала, то, что меня научили думать, меня научили очень быстро решать очень сложные задачи. И мне кажется, функция образования должна быть чем-то таким: познакомить людей с разными вещами и научить их решать сложные задачки, под них подстраиваться.
Если вы получили хорошее, фундаментальное образование, с какими-то твердыми математическими знаниями, если это экономика, значит, это, как в РЭШ, должна быть экономерика, должна быть серьезная научная подготовка, любые задачи, с которыми вы столкнетесь в бизнесе, тогда вы сможете их решить без большого труда и для вас не будет составлять сложности понять, какой конкретный тул, может быть, вам стоит освоить и как.
С точки зрения новых технологий есть очень много способов научиться дата-аналитике в первом приближении, освоить Power BI или научиться программировать на SQL — вопрос в том, что это не всегда единственное, что нужно индустрии, больше нужно всегда, чтобы человек умел думать, чтобы человек умел свои знания применять на практике. Поэтому, конечно, я всегда за фундаментальное образование, сложное, научное — все остальное потом приложится, в этом нет никаких сомнений.
— Когда мы сталкиваемся с очередной технологической революцией, это всегда приносит очень много неопределенностей. Этот год не был исключением — например, в ноябре вышло исследование профессора Стэнфордской высшей школы бизнеса Чарльза Джонса под названием «Дилеммы искусственного интеллекта» (.pdf), который назвал его палкой о двух концах. С одной стороны, отметил он, инновации будут способствовать экономическому росту, а с другой стороны, эксперты обеспокоены, что эти достижения влекут за собой экзистенциальный риск создания сверхинтеллекта, действующего несогласованно с человеческими ценностями.
Кто и как в условиях такого рода технологической неопределенности может объяснить широкой аудитории понятным языком возможности и риски этих технологий и, может быть, кроме посредников технологических, в бизнес-интеграциях ИИ, нам нужны просветители?
Станислав Мазуренко: Мне кажется, просветители — это очень хороший ход, и мы видели уже в истории похожие технологические прорывы. Например, когда я учился, уже были курсы повышения квалификации, знаете, курсы компьютерной грамотности для более старшего поколения, которое никогда не использовало компьютер в своей жизни, а сейчас они могут пойти на какие-то курсы, где им объяснят, как работать на каком-то базовом уровне. Кажется, что такой же способ можно использовать в ИИ.
То, чем мы сейчас занимаемся, мне кажется, это тоже важно: лекции, публичные обсуждения. Даже несмотря на то что у нас сейчас нет достаточно времени на то, чтобы уйти глубоко в какие-то технические детали, но мне кажется, даже вот это знакомство с инструментами и наслышанность о том, что они есть, используются и как они используются, это уже помогает людям, которые не особо знакомы с такими инструментами, немного адаптироваться к меняющейся обстановке. Ну и я уверен, что будет выходить все больше и больше курсов таких же, как РЭШ публиковал курсы финансовой грамотности, например, чтобы рассказать людям о финансовых инструментах, как откладывать на пенсию, я легко могу представить похожий курс о грамотности использования ИИ или больших языковых моделей.
Иван Стельмах: Я думаю, он почти готов — достаточно открыть ChatGPT или YandexGPT, попросить его объяснить, как 5-летнему, потом 10-летнему, 15-летнему ребенку, будет неплохой прогресс по понимаю ИИ.
— Действительно ли необходима эта задача по разъяснению этих возможностей и нужны ли нам просветители помимо посредников?
Иван Стельмах: Я думаю, конечно, да, классно рассказывать. И это крутой инструмент, которым могут пользоваться люди для того, чтобы решать интересные задачи, и чем больше людей о нем знают и умеют пользоваться, тем больше креативных решений мы можем увидеть. Но с другой стороны, я надеюсь, что собственного любопытства сейчас уже достаточно без всяких просветителей, чтобы разобраться в теме и что-то начать в ней делать.
— Дарья, что скажете, вам наверняка приходится подобного рода образовательные задачи выполнять для ваших клиентов?
Дарья Левина: Да, мы проводим тренинги по тому, как пользоваться нашим продуктом, как и любым другим приложением, и, действительно, мне кажется, роль просветителя важна, потому что она позволяет увеличить доступность. Опять же из своего опыта могу сказать, что очень многие технологии кажутся гораздо сложнее, когда на них смотришь со стороны, кажется, ну вот это что-то сложное, это вообще невозможно освоить. Написать, что такое промпт для ИИ, звучит даже страшно. На самом деле, промпт для ИИ — это просто аккуратно объяснить ему, как человеку-стажеру, что ты от него хочешь, и научиться это делать не так сложно.
Технологии в принципе движутся по пути того, чтобы ими было все проще, удобнее и приятнее пользоваться, и поэтому, конечно, если кто-то придет и покажет, что, чтобы написать имейл, теперь нужно не 20 минут, а 20 секунд, то это уже хорошо, и мне кажется, такие люди всегда будут полезны.
— «Как ИИ способен вычислять и понимать чувствительную или конфиденциальную информацию, нужен ли маркер для такой информации и как это делать с точки зрения маркирования данных, если это конфиденциально?»
Дарья Левина: Насколько мне известно, никак не умеет ИИ определять, какие данные являются конфиденциальными или нет, если вы ему про это открытым текстом не скажете. И моя личная рекомендация: никакие конфиденциальные данные в прямом виде, ничем не замаскированные, не нужно туда заливать. Если вы заливаете туда какие-то данные пользователя любому посреднику, в котором вы не очень уверены, тем более ИИ, просто замаскируйте их — это будут не конкретные пользователи, это будут непонятные номера, или их локация должна идти через какой-то номер, и вы уже на своем можете потом конце через дополнительные запросы в вашу базу данных понимать, что определенный номер — такой-то пользователь, такая-то локация.
Не стоит данные, которые могут быть чувствительными, вообще где бы то ни было распространять, в том числе ИИ. Если даже вы в своем чате отключите возможность ChatGPT сохранять ваши диалоги и на них обучаться, то чисто формально считается, что вы свои данные защитили, и этого может быть достаточно, но я бы не стала какую-то сенситивную информацию там публиковать.
— «А в стратегии используется где-то ИИ?»
Иван Стельмах: Мне кажется, как инструмент составления стратегии, он, конечно, используется, я работал в «Яков и партнеры», бывший McKinsey, и консультанты внутри активно используют ChatGPT при написании стратегий. Они не просят: а напиши мне стратегию какой-то группе компаний, но это хороший инструмент для погружения в тему, для генерации каких-то новых идей и быстрого сбора контекста. Поэтому, да, он используется, но как инструмент и помощник для построения стратегии, а не как инструмент, который саму стратегию генерирует.
Дарья Левина: Я согласна с Иваном, что по большому счету это такой помощник написания стратегии. Допустим, можно всегда к нему обратиться с вопросом: вот есть такая-то компания, верхнеуровнево, дайте мне, пожалуйста,100 идей по тому, как повысить ее продажи, он даст 100 идей, из них 80 будут либо очевидная вещь, либо полная ерунда, а 20 — это то, о чем вы бы никогда не подумали, и вот для этого вы этот запрос и написали.
Он хорош, допустим, в построении образовательной стратегии, можно сказать, у меня такой-то бэкграунд, я знаю то-то, то-то и то-то, я хочу освоить такой вот тул, скажи, пожалуйста, какая должна быть моя образовательная стратегия. И он даст какой-то перечень определенных шагов. Но опять же это должно подвергаться какому-то критическому мышлению. Полностью человека заменить он не может, это очень далеко, просто такой помощник.
— «Почему сначала не были придуманы ограничения для ИИ, еще до того как приступили к его разработке и реализации, чтобы остались те самые "старые добрые правила"? Через сколько лет ИИ по работе будет моим начальником?»
Иван Стельмах: Я надеюсь, никогда не будет ИИ начальником, я думаю — хорошим коллегой, да.
Станислав Мазуренко: Я могу прокомментировать по поводу того, как ИИ использовать в стратегических целях, но вам в любом случае его нужно контролировать и проверять стратегию. Начальником он тоже вряд ли станет очень быстро, нужно, чтобы такая задача была поставлена, обучены и были доступны данные для тренировки, а это очень в далеком будущем будет.
— Зрители интересуются, каким образом это будет регулироваться, в том числе в России. И даже была реплика от читателя «Ъ» том, как вообще регулировать то, что не существует с юридической точки зрения?
Иван Стельмах: Есть позитивное и негативное здесь. Негативное, конечно, это пока полный туман непонимания со стороны регулятора, то есть регуляторам самим тяжело технологию осознать полностью, ее техническую сторону, им тяжело придумать правильную регуляцию, есть примеры, может быть, не очень удачные, в Нью-Йорке, в Европе пытаются придумать закон.
С другой стороны, позитивный тренд — это саморегуляция области, то есть область понимает, что если она сейчас не будет о саморегуляции, то когда-то придет регулятор, выключит рубильник и скажет: ребят, сейчас вообще нельзя то-то использовать или это, и это страшно для бизнеса.
Я думаю, эти два тренда в какой-то момент уравновесят друг друга, бизнес объяснит регуляторам, как правильно смотреть на ИИ, регулятор убедится, что бизнес смотрит действительно правильно, и вместе они выработают какие-то правила, как в моем любимом Пелевине, ограничение искусственного интеллекта тремя мегатюрингами. Что-нибудь типа такого и у нас.
— «Существуют ли реестры черных разработчиков каких-то опасных и вредных алгоритмов ИИ для людей?» Когда мы выбираем инструменты для себя, как мы вообще можем понять, что они безопасны для человека?
Станислав Мазуренко: Это очень интересный вопрос, мне кажется, составление таких списков и анализ займут какое-то время, как в любой другой области, где большое количество инструментов, и в результате люди должны будут попытаться их использовать, набить шишки, понять, что в эту сторону лучше не ходить, в эту сторону мы можем попробовать идти. Через постепенное обучение мы проходим, даже когда пишем обычную программу. Потому что, если у вас есть какая-то задача, очень тяжело в самом начале уже понять, какие будут риски, в какую сторону лучше не ходить и какие будут ограничения.
Естественно, если кто-то уже до вас уже такую программу писал, то вы можете обучиться на ошибках других людей. Но так предсказывать будущие проблемы — это довольно-таки сложная задача, а мы лучше всего анализируем предыдущий опыт.
Я пока о таких списках не слышал, но, например, в академии люди создают такие интуитивные списки, когда кто-то публикует новую определенную модель, вы ее пробуете на данных, она не работает, ну ок, запомним, что, может быть, модели, которые создаются в этой лаборатории, нужно как-то перепроверять. Я думаю, что это работает, как со статьями, со знаниями и с поиском источников — так это будет работать и с моделями ИИ.