Интернет бурно отреагировал на созданное искусственным интеллектом видео, на котором Мона Лиза с картины Леонардо да Винчи поет под рэп, который написала и исполнила актриса Энн Хэтэуэй. Реакции — от хохота до ужаса.
Клип вызвал в сети реакцию от веселого юмора до ужаса и осуждения. Это видео — один из трюков новой технологии искусственного интеллекта Microsoft под названием VASA-1. Технология способна генерировать реалистичные говорящие лица виртуальных персонажей, используя всего одно изображение и речевой аудиоклип. ИИ может заставить героев мультфильмов, фотографий и картин петь или говорить
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024
В вирусном ролике Мона Лиза поет, ее рот, глаза и лицо двигаются под «Папарацци» — рэп, написанный Хэтэуэй и исполненный на ток-шоу Конана О’Брайена в 2011 году.
Видео быстро завоевало популярность в Интернете. Times cообщает, что пост на X (ранее Twitter) от 18 апреля с клипом поющей Моны Лизы по данным на воскресенье собрал семь миллионов просмотров.
Реакция быстрой, сильной и повсеместной. Некоторым клип понравился, кто-то написал что от видео Моны Лизы они «катались по полу от смеха». Другие были встревожены: «Это дико, причудливо и жутко одновременно». «Еще один день, еще одно ужасающее видео с искусственным интеллектом».
Исследователи Microsoft рассмотрели риски, связанные с новой технологией, и заявили, что не планируют выпускать онлайн-демонстрацию или продукт, «пока мы не будем уверены, что технология будет использоваться ответственно и в соответствии с надлежащими правилами».
«Это не предназначен для создания контента, который будет использоваться для введения в заблуждение или обмана», — пишут исследователи.
«Признавая возможность неправильного использования, крайне важно также признать существенный положительный потенциал нашей технологии», — считают создатели.
«Преимущества, такие как повышение равенства в образовании, улучшение доступности для людей с проблемами общения, предложение дружеского общения или терапевтической поддержки тем, кто в ней нуждается, подчеркивают важность наших исследований…».
Последние разработки в области искусственного интеллекта происходят на фоне того, что когда правительства всего мира пытаются регулировать новую технологию и принимать законы против ее преступного использования.
Одним из примеров является дипфейковая порнография, когда лицо человека накладывается на откровенное изображение или видео без его согласия. Эта проблема затронула даже Тейлор Свифт в начале этого года.
Дипфейк — deepfake от deep learning «глубинное обучение» + fake «подделка») — методика синтеза изображения или голоса, основанная на искусственном интеллекте.