ТАЗИ АНИМИРАНА МОНА ЛИЗА Е СЪЗДАДЕНА ОТ AI И Е УЖАСЯВАЩА

Send

Енигматичната, рисувана усмивка на „Мона Лиза“ е известна по целия свят, но това прочуто лице наскоро показа стряскаща нова гама от изрази, любезно с изкуствен интелект (AI).

Във видеоклип, споделен в YouTube на 21 май, три видеоклипа показват смущаващи примери за Мона Лиза, докато тя движи устните си и завърта глава. Тя е създадена от конволюционна невронна мрежа - вид AI, който обработва информация толкова, колкото прави човешкият мозък, за да анализира и обработва изображения.

Изследователите обучиха алгоритъма, за да разберат общите форми на чертите на лицето и как се държат относително един към друг, а след това да приложат тази информация към неподвижни изображения. Резултатът беше реалистична видео последователност от нови изражения на лицето от един кадър.

За видеоклиповете на Mona Lisa AI „научи“ движение на лицето от набори от данни на три човешки субекта, произвеждайки три много различни анимации. Докато всеки от трите клипа все още беше разпознаваем като „Мона Лиза“, вариациите във външния вид и поведението на обучителните модели отдадоха различни „личности“ на „живите портрети“, Егор Захаров, инженер от Института за наука и технологии „Сколково“, и Samsung AI център (и двете се намират в Москва), обяснено във видеото.

Захаров и неговите колеги също генерираха анимации от снимки на културни икони на 20 век като Алберт Айнщайн, Мерилин Монро и Салвадор Дали. Изследователите описаха своите открития, които не бяха подложени на проверка, в проучване, публикувано онлайн на 20 май в списанието за предпечат arXiv.

Запознати лица придобиват непознати изрази. (Кредитна снимка: Е. Захаров и др.)

Изготвянето на оригинални видеоклипове като тези, известни като deepfakes, не е лесно. Човешките глави са геометрично сложни и силно динамични; 3D моделите на главите имат "десетки милиони параметри", написаха авторите на изследването.

Нещо повече, системата за човешко зрение е много добра за идентифициране на "дори дребни грешки" в 3D моделирани човешки глави, според проучването. Виждането на нещо, което изглежда почти човешко - но не съвсем - предизвиква усещане за дълбоко безпокойство, известно като ефект на тайнствената долина.

Преди това AI демонстрира, че е възможно създаването на убедителни дълбочинни фейкове, но това изисква множество ъгли на желания обект. За новото проучване инженерите представиха AI на много голям набор от референтни видеоклипове, показващи човешки лица в действие. Учените установили лицеви ориентири, които биха се прилагали за всяко лице, за да научат невронната мрежа как се държат лица като цяло.

След това, те обучиха AI да използва референтните изрази за картографиране на движението на характеристиките на източника. Това даде възможност на AI да създаде дълбочина, дори когато имаше само едно изображение, от което да работи, съобщават изследователите.

И повече източници на изображения дадоха още по-подробен резултат в крайната анимация. Видеоклипове, създадени от 32 изображения, а не само от едно, постигнаха "перфектен реализъм" в потребителско проучване, писаха учените.

Send