В конце прошлого года на портале arXiv появилась статья с описанием алгоритма StyleGAN, который позволял искусственному интеллекту нарисовать человеческое лицо.
Причём такое лицо не отличалось от настоящего – люди не могли отличить одно от другого. Работает алгоритм как бы соперничая сам с собой: в нём есть две части, одна генерирует изображение, а вторая сравнивает результат с теми фото, которые ей дали для обучения. В результате система учится на своих ошибках.
Однако с котиками фокус не прошёл – результаты (на фото внизу) оказались, мягко говоря, странными: лишние ноги, перекошенные морды, слишком длинное или слишком короткое туловище и пр. Проблема, очевидно, в тех фото, на которых пришлось учиться несчастному искусственному интеллекту.
Если портретные человеческие фото были более-менее однообразны, и в них легко выделить разные части лица, чтобы потом их анализировать, то фото котиков намного, намного разнообразнее. В обучающей базе были котики крупным планом и средним планом, с закрытыми глазами и открытыми, свернувшиеся в клубок и вылизывающиеся, поштучно и по несколько котиков в одном кадре и т. д. При этом алгоритм не знал, что такое нормальная кошка, сколько у неё должно быть ног или глаз – он должен был представить её по тому материалу, который был в распоряжении. Так что нет ничего удивительного в том, что искусственный интеллект начал генерировать ночные кошмары художника-сюрреалиста.