Media Review

Об искусственном интеллекте без хайпа

Фото: kcrw.com

Искусственный интеллект (ИИ) — одна из немногих научно-технических тем, которые интересуют и широкую общественность, и власть. То, что эта тема приобрела государственное значение, говорит факт участия Владимира Путина в обсуждении проблем развития искусственного интеллекта в России.

В развитии теоретических и прикладных исследований в области искусственного интеллекта в России и в мире одну из ключевых ролей играет школа академика РАН Юрия Журавлева, который создал новые направления в науке, такие как теория локальных алгоритмов оптимизации, алгоритмы вычисления оценок, алгебраическая теория алгоритмов. Наш журнал уже публиковал интервью, посвященные этой тематике, одного из ведущих представителей этой школы академика РАН Константина Рудакова и его сотрудников доктора технических наук Виктора Финна и доктора физико-математических наук Михаила Забежайло.

В декабре минувшего года состоялась очередная конференция «Интеллектуализация обработки информации», председатель оргкомитета которой является Юрий Журавлев, а одним из сопредседателей программного комитета — Константин Рудаков, тоже посвященная темам, которые обычно называются искусственным интеллектом. Мы встретились с ученым секретарем оргкомитета конференции, исполнительным директором компании «Антиплагиат» Юрием Чеховичем, чтобы узнать какие темы находятся в центре внимания ученых. Но начали с вопроса о том, почему в названии этой конференции, и в представленных докладах отсутствуют слова «искусственный интеллект», хотя сейчас это хайповое словосочетание, и все, кто хочет произвести впечатление на публику, его использует. Хотя тематика докладов соответствующая.

Исполнительный директор компании «Антиплагиат», ученый секретарь оргкомитета конференции «Интеллектуализация обработки информации» Юрий Чехович

— Дело в том, что эта конференция была придумана в 1989 году, а тогда, конечно, слова «искусственный интеллект» были, но этой хайповости в них на тот момент еще не было. Если говорить о существующем названии, то, конечно, мы занимаемся обработкой информации, но не любой обработкой, а умной, интеллектуальной. Так и получилась «Интеллектуализация обработки информации». Кстати, английское название, которое возникло сильно позже, звучит чуть более хайпово: Intellectual Data Processing.

— Но и в докладах слова «искусственный интеллект» не употребляются…

— Потому что в нашей среде называть сейчас что-то искусственным интеллектом — это какое-то привнесение лишней пафосности. Это было бы примерно так же, как часто повторять слово «математика»: нет нужды друг перед другом повторять, что мы математики. Думаю, аналогично обстоят дела и в других профессиональных областях: вряд ли онкологи на своих конференциях очень часто произносят «лекарство от рака».

— Другие, наоборот, используют их именно для соответствующего пафоса.

— Потому что им нужен хайп, им нужны просмотры. Но я сейчас гораздо спокойнее отношусь к тому, что слова «искусственный интеллект» используются налево и направо, часто не по делу. А почему? Все-таки это популяризация. Может, благодаря этому молодежь, студенты и выпускники технических вузов, хочет заниматься нашей областью. Это способствует притоку кадров. Но есть, правда, и нежелательный побочный эффект: и у этой молодежи, и у всего общества возникают завышенные ожидания. Многие ждут, что искусственный интеллект решит все проблемы, и скорее всего удивятся, когда этого не произойдет. А не произойдет совершенно точно.

— Как бы вы сформулировали основные темы и направления работы конференции?

— В первую очередь это то, что посвящено нейронным сетям и глубокому обучению. Много докладов было посвящено традиционной тематике, связанной с изображением. Было несколько докладов по звуку и речи. Как всегда была стабильная доля докладов, связанных с эффективностью алгоритмов. Много было по медицине. Медицина — это большой постановщик задач для нашей области. Были доклады, связанные с элементами математического моделирования и с классическими алгоритмическими задачами, такими как «коммивояжер» и «рюкзак». Была секция по текстам, тоже довольно представительная. Был, как обычно, класс докладов вида «я придумал еще один алгоритм». В принципе, таких вещей сейчас меньше. Все-таки все уже понимают, что такого рода вещи нужно подкреплять очень серьезно, и в чистом виде подобных докладов было не очень много.

— Понимая условность слов «искусственный интеллект», как бы вы его все-таки определили в безхайповых терминах?

— В безхайповых это алгоритмы информационного моделирования. То есть когда на входе есть такой-то набор данных, может быть колоссальный и очень большой, а на выходе есть тоже некий информационный результат. Допустим, на входе у нас фотография или набор фотографий человека, который смотрит в видеокамеру своего телефона, а на выходе система впускает его в приложение или не впускает. Или на входе аудиопоток диктофона, а на выходе — текст.

Или, например, управление транспортными средствами. На входе очень много данных, а на выходе-то, по большому счету, тоже достаточно простой результат: разогнаться, затормозить, сохранить скорость, налево, направо, прямо — хотя понятно, что там все тоньше: углы поворота важны, важны усилия. Но в информационном смысле это все равно очень простые данные. А для обывателей это чудо, потому что машина едет сама. На самом деле она просто в секунду решает огромное количество задач анализа данных, собираемых со всех датчиков, которые у машины есть. И, соответственно, там решается куча вопросов безопасности, и очень желательна предиктивная аналитика, то есть хорошо понять, как это делает опытный водитель, что может произойти в ближайшую секунду или несколько. Когда, например, водитель едет по узкой улице и видит идущего пешехода, он понимает, что пешеход может резко дернуться, и поэтому нужно ехать медленнее или чуть в сторону взять. Если такие вещи будет делать беспилотный автомобиль, то, с точки зрения обывателя, конечно, машиной управляет искусственный интеллект. А с точки зрения машинного обучения это хороший набор задач, которые нужно решать с хорошим качеством. Потому что ошибки здесь могут очень дорого обойтись. То есть, если безхайпово, то это потоковое решение задач машинного обучения и анализа данных. Получили новые данные — быстро посчитали новое решение, и так постоянно. Вот что такое сейчас искусственный интеллект. Согласитесь, с фантазиями немного не совпадает.

Председатель оргкомитета конференции «Интеллектуализация обработки информации», заместитель директора по научной работе Вычислительного центра РАН, заведующий кафедрой «Математических методов прогнозирования» МГУ, академик РАН Юрий Журавлев
Фото: Wikipedia

Человек и ИИ

— А какое место, по вашему мнению, может занять искусственный интеллект (будем пользоваться этими словами, поскольку люди уже привыкли к ним) в жизни людей, в жизни общества?

— Все эти страшилки, что искусственный интеллект станет умнее человека и поработит его, — это все глупости. Искусственный интеллект, на мой взгляд, займет место помощника человека. Например, есть различные устройства, с которыми мы взаимодействуем голосом. В каких-то областях это вообще вещь незаменимая. Допустим, для людей с проблемами зрения. И вообще это очень удобно, когда можно голосом отдавать команды и не надо куда-то смотреть, не надо нажимать на кнопки. Другое направление — это всевозможные распознавания. Моя мечта, чтобы появились хорошие алгоритмы, которые могли бы описывать изображение в виде текста. То есть рассказывать о том, что изображено, как если бы это рассказывал человек. И, что более интересно, преобразование видео в текст. Представьте себе искусственный комментатор, допустим, футбольного матча. Понятно, что с Озеровым он не сравнится по части эмоций, но, чтобы просто дать подстрочник, необязательно нужны эмоции.

Много аналогичных задач, связанных с геологоразведкой, с медициной. Медицина за последние лет двадцать-тридцать очень сильно продвинулась именно благодаря машинному обучению, или, так сказать, искусственному интеллекту. Там очень много данных — это и рентген, и томография, и ЭКГ, и УЗИ, и результаты различных анализов, которые необязательно выражены в числовой форме. Человеку для проведения такого анализа и сопоставления результатов данных требуется очень серьезное умение и очень большое время. А машине можно поручить колоссальный объем предобработки. Хороший пример, правда не в медицине, но тоже связанный с обработкой большого количества разнообразных данных, — поиск бозона Хиггса на Большом адронном коллайдере, когда машине поручили поиск возможных кандидатов на основе гигантского объема данных, получаемых с большого количества детекторов. Колоссальная задача. Понятно, что человеку было нереально перебрать все варианты. А машину вполне можно научить. И это получилось. Но это не умение мыслить.

Бытовое понимание искусственного интеллекта состоит в том, что это будет умный компьютер. Умного компьютера не будет. Он, конечно, становится умнее и полезнее, но это компьютер, который всегда действует по заложенному в него алгоритму. Но мыслить как человек он никогда не будет.

— Иногда показывают, как искусственный интеллект пишет стихи или рисует картины, которые выглядят вполне по-человечески. Это тоже просто реализация алгоритма, в этом нет ни эмоций, ни размышлений?

— Конечно. Вообще, машинное стихосложение — это область еще дохайповая. Я помню в девяностые годы, когда я учился на Физтехе, в книжке «Физики тоже шутят» было машинное стихотворение. По-моему, оно звучало так: «Пока слепо плыл сон по разбитым надеждам, / космос болью сочился из распахнутых ран. / Был из скрытных людей свет твой медленно изгнан, / и небо не спало». Вполне человеческие стихи. Но дело в том, что такие стихи алгоритм генерирует со скоростью примерно 100 тысяч четверостиший в секунду и отобрать из них то, что представляет интерес, — это как раз человеческая задача, потому что нет алгоритма, который скажет:

«Да, это красиво, а тут бред полный».

Для этого как раз человек нужен. Я также думаю, что машина способна на генерирование миллиона картин, но из них выбрать то, что концептуально, а что нет, для этого нужен человек, и от этого никуда не деться. А стихи — это очень алгоритмично: рифма легко проверяется, размер тоже понятен, самое главное под этот правильный размер подбирать слова так, чтобы там не было невозможных словосочетаний вроде «стремительного домкрата». Так что на самом деле тут даже искусственного интеллекта нет. А вот генерация текстов на определенную тему — это область вполне себе для искусственного интеллекта. Многие фейковые новости пишутся искусственным интеллектом.

— Были примеры, когда научную статью генерировали, отсылали в научный журнал и журнал позитивно ее оценивал.

— Это давняя история. Я хорошо в теме, так сказать, по роду своей основной деятельности. Михаил Гельфанд, известный человек, взял генератор научных текстов на английском языке создал с помощью него текст, затем с помощью машинного переводчика перевел текст на русский язык, слегка подправил стилистику, и отправил в ваковский журнал. Это была демонстрация скорее не возможностей искусственного интеллекта, а качества рецензирования в некоторых ваковских журналах. Дальше ему прислали замечание рецензента. Он их исправил, хотя в статье ничего кроме бреда, не было. И ее опубликовали.

После чего Гельфанд предал гласности всю эту историю. Был скандал и журнал из списка ВАК исключили.

В области искусственной генерации текстов вполне серьезные алгоритмы работают. Конечно, если я увижу искусственный текст по своей узкой области, то, конечно, пойму, что он искусственный. Но если мне, допустим, покажут десять статей по медицине, из которых пять будет искусственных, пять настоящих, то я, наверное, не отличу искусственные тексты от настоящих. Просто потому, что не моя область. И это как раз отлавливается наличием тех или иных «стремительных домкратов», то есть несочетаемых понятий, которые специалист в этой области видит, а для остальных людей вся атрибутика научной статьи будет соблюдена и текст будет вполне наукообразный.

— А все-таки, если говорить о перспективах развития того, что называют «искусственным интеллектом, считаете ли вы возможным создание именно интеллекта, то есть думающей машины с некими может быть даже чувствами по отношению к предмету размышления?

— Я считаю, что скорее нет. Слишком велика сложность человека, даже если оценивать только вычислительные возможности мозга, пока они еще на много порядков опережают те возможности, которые есть у искусственных вычислительных систем. А способность думать и творить — это следствие сложности человеческого мозга, и вычислительным машинам до этой сложности еще очень далеко. Тем более на существующих кремниевых технологиях. Да и до способности написать программы такой сложности, какой является та же ДНК, а такие попытки есть, пока недостижимо далеко.

Сопредседатель программного комитета конференции «Интеллектуализация обработки информации», заместитель директора Федерального исследовательского центра «Информатика и управление» РАН, заведующий кафедрой «Интеллектуальные системы» Московского физико-технического института, академик РАН Константин Рудаков
Фото: Дмитрий Лыков

Задачи, которые приходится решать

— Вы сказали о различных вариантах распознавания. Я, как журналист, жду, когда, наконец, появятся диктофоны с распознаванием речи, с которых я смогу снимать не звуковую запись, а текстовой файл…

— Я так понимаю, что в YouTube субтитры с английской речи делаются уже вполне приличные. Эта технология очень близка к той, о которой Вы говорите. То есть для английского это уже в хорошей стадии. Я надеюсь, что и для других языков будет доведено. Другой вопрос, что тому, кто разрабатывает такой алгоритм, нужно понимать, что он на этом заработает. А прямая продажа устройств или софта — это не самый комфортный способ монетизации. Гораздо комфортнее монетизировать такую разработку через встраивание софта в абсолютно все устройства: iPhone, Samsung и другие. В то, что продается во всем свете. На чем можно зарабатывать хотя бы несколько центов с устройства. Мне кажется, что эта задача в ближайшее время будет решена.

Сейчас, например, РВК проводит конкурс «Прочтение», смысл которого в том, чтобы создать алгоритм, который проверял бы ЕГЭ в творческую часть текстов по нескольким школьным предметам не хуже, скажем так, живого преподавателя. Есть несколько групп ошибок: грамматические, речевые, логические, фактические, этические. И в каждой группе есть много типов. Необходимо анализировать текст так, чтобы эти ошибки выделять, подсвечивать, давать их пояснение. Недавно подводили итоги первого этапа этого конкурса. Сейчас понятно, что пока не приблизились к человеческому качеству, но, по крайней мере, какой-то шаг сделан.

— Но там же от руки пишут эти тексты?

— Да, это проблема, но сейчас есть уже датасеты оцифрованных текстов ЕГЭ, в том числе оцифрованных в честном виде, так что ошибки там тоже сохранены. То есть, если ученик ошибся, то эту ошибку сохранили при оцифровке, не поправили, это важно.

— То есть экзаменующиеся будут писать уже не от руки, а набирать.

— Рано или поздно, уверен, так будет. А пока конкурс будет развиваться дальше. К нему можно будет подключиться на любом этапе, а призовой фонд, на секундочку, двести миллионов рублей. Это серьезное вложение в эту экосистему со стороны РВК. Это поднимает интерес к тому, чтобы разные команды начали этим заниматься.

Вообще, в мире конкурсов по анализу данных проводится огромное количество. Был знаменитый конкурс Netflix. Он был посвящен созданию предсказательных систем. То есть алгоритмов, которые хорошо предсказывали бы интерес пользователя к фильмам на основе его истории просмотров. Какие фильмы ему стоит порекомендовать так, чтобы он их заведомо выбрал? Это был конкурс на миллион долларов, который собрал огромное количество команд-участников.

И такие истории, кстати, развивают как бизнес, так и науку.

— А почему проводятся эти конкурсы? На какой вопрос они должны ответить?

— Это конкурсы на качество алгоритмов: насколько ты сведешь к минимуму количество ошибок, которые допускает твой алгоритм. Потому что данные всегда плохие, нечеткие, неконкретные. Та же задача от Netflix. Кто знает, почему человек, который посмотрел, скажем, десять каких-то фильмов, должен посмотреть именно этот, одиннадцатый? Может, это не он смотрел, может быть, через его устройство посмотрел его сын, брат, жена или вообще несколько человек? И это всего лишь один сценарий появления ошибок в данных.

Или при распознавании лиц: колоссальная проблема, например, темные очки. Понятно, что два человека в темных очках гораздо больше похожи друг на друга, чем они же похожи на себя же без очков. То есть алгоритм должен понять, что на фотографии, на изображении присутствуют очки, устранить их, и анализировать только те области, которые не охвачены очками. То же самое касается прически. То же самое касается усов там бороды и так далее. И масса таких факторов.

А сейчас проблема в масках. В этом году все стали ходить в масках и когда пытаешься заплатить за что-то в магазине, и приходится снять маску, чтобы показать себя телефонe, а потом платить. Потому что разработчики софта по распознаванию лиц не предполагали, что человек значимое время будет находиться в маске.

Это пример тех требований, которые диктует реальная жизнь к конкретным реализациям систем реализации.

«Умного компьютера не будет. Он, конечно, становится умнее и полезнее, но это компьютер, который всегда действует по заложенному в него алгоритму. Но мыслить как человек он никогда не будет»
Фото: new.siemens.com

Условия далеко не идеальны

— Практически одновременно с вашей проходили еще две конференции, в том или ином виде связанные с обсуждением проблем искусственного интеллекта. И на одной из них прозвучало мнение, что у нас в России неплохо с бизнесом в области искусственного интеллекта, но не очень хорошо с наукой. А мне как раз академик Рудаков и его сотрудники в своих интервью говорили ровно наоборот: с наукой-то у нас как раз очень неплохо, а бизнес есть неплохой, но не такой массовый, как где-нибудь на Западе. На ваш взгляд, каково соотношение нашей и западной науки, соотношение нашего и западного бизнеса в этой области? В обобщенном, так сказать, виде.

— Мне кажется, что у нас есть примеры, что называется, и там и там: и в части бизнеса, и в части науки. Очень хотелось бы их сохранить и развить. Но, к сожалению, сейчас условия и для науки, и для бизнеса, скажем так, далеки от идеальных. Естественно, что в той же Кремниевой долине для бизнеса сформировалась та самая питательная среда, когда куча идей варится в головах, собранных одном месте, в первую очередь географически. В результате возникают прорывные идеи. У нас тоже есть какие-то вещи, которыми можно гордиться. Но это скорее «вопреки», к сожалению. Но мне кажется, что пока еще наши столпы отечественного образования производят хорошие кадры, что для нашей области является очень серьезным фактором. Пока есть молодые ребята, с огнем в глазах, которые действительно хотят этими вещами заниматься. Хочется, чтобы этого было больше, чтобы это соответствовало нашим амбициям как страны. На мой взгляд, пока это все, скорее, несколько местечково.

— И в науке тоже?

— И в науке тоже. Наши ребята ездят, выступают на ведущих конференциях. Но желания, допустим, их ведущих ученых приехать сюда и выступить или хотя бы выступить в удаленном режиме, не прослеживается. То есть все-таки какие-то позиции мы теряем.

— Но, казалось бы, на конференцию Сбербанка приехали какие-то иностранцы более или менее заметные.

— Этому можно только порадоваться. Я на самом деле не против всех конференций. Сбер в последнее время очень активно претендует на роль лидера в области Data Science. Очень хорошо. Буду рад, если у них что-то получится. Буду рад, если будет получаться у кого-то еще.

Математика, алгоритмы и интуиция

— А какие основные научно-теоретические проблемы стоят перед интеллектуализацией обработки данных? Что сейчас самое актуальное с научной точки зрения?

— Думаю, это те же вопросы, которые стояли значительную часть всей истории искусственного интеллекта, машинного анализа данных. В первую очередь это задача, которая стоит всегда и у всех, и в теории, и на практике: как добиться решения наилучшего качества. Такого решения, которое обеспечивало бы наилучший результат. Понятно, что специфика задач анализа данных в том, что почти никогда не удается построить решение со стопроцентным качеством. Исследователи обычно только приближаются к корректному решению, то есть к решению абсолютной точности.

А теперь представим ситуацию: мы на некоторых данных обучили модель, добились, как нам кажется, максимально возможного качества алгоритма. Где гарантия, что на новых данных, на которых эта модель будет работать в жизни, она не «развалится», то есть сохранит свое качество? Здесь возникает целый комплекс проблем, начиная с вопросов формирования представительных наборов данных, которые хорошо представляют свойства всей «генеральной совокупности», то есть тех данных, на которых алгоритм будет работать, до особенностей алгоритмических моделей, их пригодности в конкретных случаях. Первые подходы к решению этой проблемы были предложены в 70-х годах XX века, но вопрос пока еще далек от решения.

— А какая математика здесь используется?

— Если широко, то это методы дискретной математики: математическая логика, комбинаторика, теория графов, теория алгоритмов, теория расписаний. Обязательно методы оптимизации, в том числе дискретная оптимизация. Хороший специалист в области математических методов анализа данных должен более или менее прилично ориентироваться во всех этих разделах. По крайней мере, представлять, что это решение можно поискать в той или иной области. То есть иметь хорошую математическую эрудицию.

— Вопрос, возможно, немножко наивный. Чем сложнее алгоритм, тем сложнее железо, которое его реализует?

— Не обязательно. Общий принцип: сложность алгоритма должна быть адекватна сложности задачи. Но это, скорее, то, что нужно чувствовать, и у людей, которые решают реальные задачи, успех от неуспеха часто отделен этим чувством.

— То есть разработчику алгоритмов надо, в известном смысле, еще и интуицией какой-то обладать?

— Естественно. Известна байка про Туполева, которому было достаточно посмотреть на модель самолета и сказать: полетит или не полетит. У хорошего разработчика алгоритмов тоже должна быть такая инженерная смекалка. Он должен посмотреть задачу, посмотреть данные и сказать: тут можно попробовать это, это и это. Понятно, что можно попробовать больше, но проблема в ограниченности времени и ресурсов, поэтому начинаешь пробовать с того, что, как представляется тебе, дает наивысшие шансы на реализацию. С того, что взлетит. Понятно, что это как раз переход от чистой науки к бизнесу. Чистая наука оперирует рафинированными вещами, а бизнес — экономикой. Ты можешь, допустим, предложить какое-то решение, но оно будет работать только на суперкомпьютере. Но у тебя не помещается этот суперкомпьютер в бизнес. И ты не заработаешь на решении этой задачи столько, сколько будет стоить суперкомпьютер. Значит, приходится решать более простыми методами.

И вообще, современный разработчик, если идет речь о реальных задачах, не пишет все сам с нуля, а использует массу наработанных библиотек, которые, кстати, снижают порог входа в профессию для молодых исследователей и позволяют быстро сконструировать какое-то решение, чтобы хотя бы пощупать задачу, что называется, на лету.

Сайт antiplagiat.ru — это лидер рынка России и стран СНГ по поиску заимствований в текстовых документах.

Антиплагиат и его развитие

— Вы же еще и один из руководителей фирмы «Антиплагиат».

— Да, руководитель и один из основателей компании.

— Проблему плагиата, я так понимаю, вы решили, а чем сейчас занимаетесь?

— Ну, не совсем пока решили. Если коротко то, когда в 2005 году мы начинали, стояла даже не проблема плагиата, а проблема списывания, потому что появился интернет и студенты начали массово скачивать из него рефераты и дипломные работы, меняли титульные листы и защищали как свои. Конечно, на таком уровне мы проблему решили. И сейчас только очень смелый студент может скачать работу и пытаться защитить как свою.

Сейчас мы решаем, например, такую задачу, как переводной плагиат. Когда берется английский текст, переводится на русский язык и выдается за оригинальный русский текст. У нас есть решение, которое, кстати, на промышленном уровне единственное в мире, которое позволяет это определить.

Естественно, сначала мы сделали алгоритм обнаружения плагиата при переводе с английского на русский. Кстати, для теста мы прогнали через это решение два с половиной миллиона научных статей на русском и выявили более двадцати тысяч примеров переводных заимствований. Были случаи, когда статьи, кроме перевода, не содержали ничего. Позже добавили к возможностям алгоритма работу с языками наших соседей по СНГ: казахским, киргизским.

Сейчас делаем алгоритм, который должен искать переводные заимствования в любую сторону в рамках ста языков. То есть, если кто-то возьмет текст на китайском и переведет, допустим, на шведский, мы это должны находить.

Был, кстати, пример, когда китайский студент взял несколько статей на китайском, перевел их на английский и пытался защититься в российском вузе. Нашли. Китаец не защитился.

Есть еще проблема, как отличить добросовестное заимствование или цитирование от плагиата. Есть проблема, которая связана с повторяющейся терминологией. Химики особенно страдают, потому что там длинные сложные слова, которые часто повторяются, и алгоритм это воспринимает как заимствование. Химикам это не очень нравится, потому что они, по большому счету, не могут это сказать иначе. Это то, что еще предстоит совершенствовать.

Из задач, которые нам интересны, это, например, воровство картинок. Специалисты издательства Elsevier оценивают долю статей с ворованными изображениями в несколько процентов. Допустим, взяли изображения, немного их подкорректировали и опубликовали свою статью на основе этих изображений. При этом текст полностью новый, то есть обычный анализ текста не поможет. А несколько процентов — это сотни тысяч публикаций в год.

Еще одна задача — автоматическое создание, например, аннотации длинного текста. В общем, задач у нас много. И чаще всего эти задачи решаются именно методами анализа данных, или, если кому-то нравятся эти слова больше, искусственного интеллекта.

Автор: Александр Механик.



Место проведения: