Сможет ли искусственный интеллект писать новости?

Может ли искусственный интеллект предсказать итоги выборов, как работает контекстная реклама, в чем отличие между искусственным интеллектом и машинным обучением, в интервью дружественному порталу Indicator.Ru рассказал доцент Сколковского института науки и технологий, заведующий лабораторией интеллектуального анализа данных и предсказательного моделирования Института проблем передачи информации РАН Евгений Бурнаев. Мы с удовольствием публикуем эту беседу.

сможет ли искусственный интеллект писать новости

— Евгений, вы занимаетесь искусственным интеллектом и машинным обучением. Я хочу понять, насколько искусственный интеллект – это то, что уже вокруг нас? В последнее время я осознал, что чуть ли не каждый день слышу это словосочетание.

— Мне кажется, тут может быть велика роль маркетинга. Безусловно, сейчас машинное обучение очень активно развивается, но и более «классические» вещи, такие, как, например, физическое моделирование, по-прежнему очень актуальны.

Приведу конкретный пример – управление роботизированной рукой (манипулятором). Если вы меняете какие-то управляющие параметры, то манипулятор в ответ на это начинает двигаться определенным образом. Соответственно, можно собрать входные и выходные данные и построить по ним модель «черного ящика» (модель черного ящика – модель системы с известными входными и выходными данными и неизвестным внутренним устройством). В данном случае входные данные – это управляющее воздействие, а выходные – положение роботизированной руки.

Используя построенную модель, можно управлять этой рукой: вы рассчитываете, как она будет двигаться в ответ на управляющее воздействие, а затем подбираете такое воздействие, чтобы положение руки отвечало вашим требованиям. Как раз так и работает машинное обучение.

Проблема в том, что, прогнозы имеют погрешности, а значит, возможно, манипулятор будет управляться не очень эффективно. Поэтому правильно каким-то образом комбинировать не только модели, полученные с помощью машинного обучения, но и модели на основе физики процессов.

Я начинал свою профессиональную деятельность с применения машинного обучения в задачах индустриальной инженерии, и такого рода ситуации возникали: нужно было тем или иным образом комбинировать модели разного типа. Например, очень часто инженеры-аэродинамики знают, что при каких-то значениях чисел Маха, Рейнольдса некоторые аэродинамические характеристики изделия зависят почти линейным образом от группы входных параметров. Однако когда вы построите с помощью методов машинного обучения модель, то в ее прогнозах будут неточности, из-за которых вот это поведение изделия – почти линейная зависимость аэродинамических характеристик от некоторой группы входных параметров – будет недостаточно точно воспроизведено.

Если же при построении прогноза использовать модель на основе физики процессов (пусть даже упрощенную), то она позволит воспроизвести известные особенности зависимости (например, почти линейное поведение). В свою очередь модель, построенная методами машинного обучения, позволит уточнить этот прогноз (в примере с манипулятором – позволит построить более точное управление его движениями).

Моя научная группа разрабатывает и успешно применяет специальные математические подходы для эффективного комбинирования моделей этих двух типов. При этом так как «детальные» физические модели обычно вычислительно очень затратные, то непосредственно встраивать в аппаратное обеспечение возможно лишь только «грубые» физические модели, и роль машинного обучения — уточнение прогнозов таких физических моделей — только возрастает.

Так что машинное обучение сейчас – это очень активно развивающаяся область, но не стоит забывать и про классические модели и методы.

— Интересно, что вы ни разу не произнесли слова «искусственный интеллект», зато сказали несколько раз «машинное обучение». Получается, мы говорим «машинное обучение», а подразумеваем «искусственный интеллект», или это не совсем верно?

— Я бы сказал, что «машинное обучение» — это класс математических методов, которые позволяют решать некоторые хорошо поставленные математические задачи. А «искусственный интеллект» — это когда вы пытаетесь сделать некую систему, которая будет делать выводы, используя решения соответствующих задач машинного обучения. Получается, вы как бы из конструктора собираете систему, которая умеет делать прогнозы и принимать решения.

Представим себе, что вы находитесь в машине и голосом говорите: «Хочу построить маршрут», «Хочу включить музыку» или спрашиваете «Как мне лучше проехать туда-то?». А машина вам отвечает: «Бензин закончился», «Мотор починить надо», или еще что-нибудь. Можно сказать, что это — зачатки искусственного интеллекта.

Когда делается приложение такого типа, оно состоит из ряда компонент, и каждая компонента решает определенную задачу. Когда человек говорит, его речь должна распознаваться. Распознавание речи – это конкретная задача. Когда речь распозналась, из нее надо вычленить те команды, которые человек хочет передать машине, и сделать так, чтобы машине это было «понятно», — а это уже другой набор задач. Соответствующие математические задачи решаются методами машинного обучения.

— Я приведу три примера из жизни – прокомментируйте, пожалуйста, каждый. Пример первый. У меня есть дочка. Ей бабушки и дедушки подарили говорящую куклу: такая большая, отечественного производства, которая распознает какие-то слова. Она выглядит несколько тупо, иногда говорит что-то невпопад. Но вот, например, скажешь ей: «Дура», а она в ответ: «Это ты – глупая. Я с тобой не буду больше играть». Есть реакция, и она реальная. Вначале мы сами не поверили, но проверяли — она есть. Можно ли сказать, что в кукле внутри находится искусственный интеллект? И кукла стоит несколько тысяч рублей – получается, все так доступно и дешево?

— У меня есть подозрение, что там зашиты определенные стоп-слова и их комбинации, а также прописано конечное количество реакций на эти слова. А искусственным интеллектом было бы правильнее назвать то, что может хоть как-то автоматически «обобщаться». Если у вас есть конечное множество примеров, то распознавание одного из них — это не искусственный интеллект.

Например, рассмотрим классическую задачу распознавания объектов на фотографиях. Если у вас есть конечное количество фотографий, вы просто можете запомнить, какие на них изображены объекты. Однако такое решение не позволит вам распознавать объекты на новых фотографиях — для этого система должна обладать обобщающей способностью. Вопросы оценки обобщающей способности алгоритмов – одни из самых интересных с научной точки зрения, и я ими занимаюсь в рамках проводимых моей научной группой исследований.

То же самое и в этой кукле. Если бы она смогла реагировать соответствующим образом не только на слово «дура», а еще на какие-нибудь другие слова, которые по значению сходны со словом «дура», то это можно было бы назвать некоторой способностью к обобщению.

— То есть если искусственный интеллект не обучается, то это просто машина. Второй пример — выборы президента США. Социологи ошиблись, не сумев предсказать их результат. А некий индийский медицинский стартап сообщает, что с помощью искусственного интеллекта чуть ли не двенадцать лет правильно предсказывает итоги выборов. Слышали ли вы что-нибудь про это?

— В силу того, что я сильно загружен работой, за этими выборами просто наблюдал в Facebook — там все бурлило. А про стартап ничего не знаю. С большой вероятностью этому стартапу могло сильно «повезти». Прогнозированием исхода выборов занимается достаточно большое количество людей, по этой причине всегда имеется достаточно большое число разных прогнозов. И какая-то комбинация прогнозов для подряд идущих выборов может оказаться правильной с большой вероятностью.

Теперь по поводу самой задачи прогнозирования итогов выборов. Давайте разберемся, каким образом подобного рода задачи вообще решаются, благо что опыт решения аналогичных задач (в других областях, а не по прогнозированию исходов выборов) – у меня большой.

Что значит – предсказать исход выборов? Чтобы решить подобную задачу, необходимо собрать данные из разных источников и разработать частные модели и методы анализа и обработки таких данных. Одна модель будет проводить мониторинг интернета, чтобы выявить положительные или отрицательные мнения о том или ином кандидате, другая модель будет каким-то образом проводить мониторинг настроений людей, которые в интернете «не сидят». Как показали выборы, о которых вы говорите, в интернете — не вся правда. Вот пишут: «Хиллари Клинтон – наше все», а оказалось – нет. Оказалось, что есть много людей, которые так не считают. Поэтому должна быть другая модель, которая по косвенным признакам из иных источников данных эту информацию выявляет. Далее прогнозы, полученные с помощью каждой из частных моделей, агрегируются, и подсчитывается финальный прогноз.

В итоге речь идет о стандартной статистической модели прогнозирования. Более того, в данном случае при построении такой модели в значительной степени придется использовать социологические модели, данные об устройстве избирательной системы, учитывать специфическую социально-демографическую информацию… Причем информация такого рода в значительной степени будет встраиваться в модель вручную. В общем, я бы не назвал такого рода приложение полноценным «искусственным интеллектом».

— Третий пример из жизни. Интернет, а именно — лента Facebook, которая подстраивает выдачу под конкретного пользователя, или Яндекс-директ, когда откроешь статью про «Диссернет», а у тебя сбоку Яндекс-директ показывает «заказ диссертаций». Это искусственный интеллект или нет?

— Мне кажется, что эти два примера – это некоторый начальный уровень систем с искусственным интеллектом: прогнозные модели или модели, которые «чувствуют» корреляцию.

В соответствии с вашим User ID вы «зарегистрированы» в базе пользователей Яндекса. К этому идентификатору «привязывается» история ваших действий в интернете. Исходя из этой истории и текущих ваших действий специальная рекомендательная система предлагает показывать рекламу определенного типа – например, когда вы сделали запрос про диссертацию, система «видит» это и «рассуждает» – ага, вы открыли статью про «Диссернет» (ключевое слово здесь – «диссертация»!), значит, давайте вам покажем рекламу про диссертации. Ну а какие услуги у нас предлагают на эту тему – известно, это «заказ диссертаций». Вот это — довольно конкретный набор правил и действий.

Следующий уровень искусственного интеллекта в моем понимании – это такая система, которая может уже как-то «планировать» свои действия исходя из своих же прогнозов развития текущей ситуации и влиять на внешнюю среду. Недавние результаты в области глубинного обучения с подкреплением, где компьютер на хорошем уровне (зачастую превосходя человека) играет в различные аркадные игры – вот это интересные примеры такого рода планирования действий и влияния на внешнюю среду (игровую среду, в данном случае).

— Главный вывод для меня – это то, что искусственный интеллект может общаться и самообучаться.

— В целом, начальный уровень систем искусственного интеллекта – когда строится система, которая имитирует способность человека делать прогнозы, давать рекомендации – уже может эффективно реализовываться существующими инструментами. Однако такого рода системы обычно не самообучаются, в них нет автономности. Тот же сервис Яндекс-директ адаптируется и улучшается сотрудниками компании «вручную». По этой причине требуется разработка некоторых новых инструментов и методов машинного обучения для построения систем искусственного интеллекта следующего уровня, что и является темой моей научной работы.

— А может ли искусственный интеллект писать? Не статьи, но хотя бы новости?

— Есть различные алгоритмы, которые могут генерировать заголовки для новостей, какие-то краткие «выжимки» из них. Я думаю, что в целом можно добиться автоматизации процесса генерации новостей. Это будут не новости, в которые добавлены какие-то оценки происходящего, но, по крайне мере, это будет что-то типа отчетов: произошло вот такое-то событие, оно связано с таким-то событием.

Беседовал  Николай Подорванюк

Ссылка на источник