Дипфейков все больше. Это необязательно плохо

Мона Лиза

Автор фото, Samsung

Подпись к фото, Разработчики объяснили, как им удалось "оживить" Мону Лизу

Дипфейки окружают нас везде, и эта проблема, похоже, скоро усугубится: только недавно инженеры Samsung разработали говорящие головы, сгенерированные из одного изображения: теперь искуственный интеллект может даже вставить слова в уста Моны Лизы - или, если захотите, Александра Пушкина.

Новые алгоритмы, разработанные командой из московского Центра искусственного интеллекта Samsung и Научно-технологического института Сколково, лучше всего работают с рядом изображений, снятых под разными углами, - но они могут быть весьма эффективными и при загрузке всего одной картинки (или картины).

Согласно исследованию россиян Александры Шишеи, Виктора Лемпицкого, Егора Захарова и Егора Буркова, новая модель создания видеоаватаров может не только работать с маленькой исходной базой изображений, но и создавать компьютерные видеоролики за более короткое время.

Создание ультрареалистичной версии себя в виртуальной реальности вызывает у некоторых беспокойство, особенно когда подложные видеоматериалы - те самые дипфейки - могут быть получены с одного снимка.

Система работает, обучаясь по характерным чертам лиц, которыми затем можно манипулировать.

Большую часть изображений для обучения нейросети россияне взяли в общедоступной базе данных VoxCeleb: специалисты использовали более 7 тыс. изображений знаменитостей.

Монро

Автор фото, Samsung

Подпись к фото, Мэрилин Монро так же легко поддалась "оживлению"

Так они смогли научить нейронную сеть, как преобразовывать характерные черты совершенно разных лиц в реалистично выглядящее видео.

Полученные нейросетью навыки затем могут быть использованы для преобразования фотографий человека, которого ИИ до этого не видел.

Как и в других инструментах создания лиц, на последнем этапе процесса проверяется "идеальная" модель. Любые кадры, которые выглядят слишком неестественными, обрезаются и воспроизводятся снова, оставляя конечное видео во всё лучшем качестве.

Система и другие подобные ей должны улучшаться по мере совершенствования алгоритмов и повышения эффективности моделей обучения, а значит, нам всё труднее будет отличить дипфейки от реальных людей.

Во вред или во благо?

Один из разработчиков системы Виктор Лемпицкий поиздевался над паникой из-за дипфейков у себя в "Фейсбуке".

"План работ большой. Коммунисты просят к выборам оживить Ильича, из Кремля звонили - говорят, у них там кому-то надо срочно посоветоваться с Ганди. Планируются еще нейросетевая сегментация чакр на фото и возвращение блудных супругов путём обработки селфи (с вероятностью 95% должен возвращаться домой один из пяти последних)", - смеётся знаток нейросетей.

Эксперты обращают внимание и на то, что обучение ИИ распознаванию лиц может в конечном счёте оказаться полезным для человечества.

Например, звёздам кино и телевидения никогда не придётся стареть и умирать - искусственный интеллект скоро станет достаточно умным, чтобы создавать полностью реалистичные аватары из нескольких фотографий и в рекордно короткие сроки.

Сколковский механизм, строго говоря, не совсем нов: так, группа учёных из Университета Тель-Авива представила публике схожую с Samsung систему "оживления" портретов ещё в 2017 году.

Шимпанзе

Автор фото, ChimpFace

Подпись к фото, Иногда система распознавания лиц может спасти жизнь шимпанзе

Исследователь Супасорн Суваджанакорн из Университета Вашингтона два года назад поразил общественность своим "фейковым Бараком Обамой", который говорил и выглядел в точности как настоящий.

Для создания реалистичного изображения ученый и его коллеги обработали 14 часов записей публичных выступлений экс-президента США.

Специалист по дипфейкам сказал Би-би-си, что в ближайшие 10 лет опасаться фейковых видеомоделей не стоит, поскольку специалисты легко отличат подложные видео по движениям зубов и языка.

Суваджанакорн, при этом, в будущем предвидит использование подобных технологий для создания онлайн-аватаров умерших людей, по которым скорбят родственники, или представителей прошлых эпох.

И необязательно воссоздавать именно человеческое лицо: например, зоозащитники вместе с экспертом по цифровым инновациям Колином Маккормаком придумали сходным образом работающее приложение ChimpFace, чтобы распознавать лица шимпанзе и препятствовать браконьерскому истреблению этих животных.