Статті
Як дипфейки змінюють фотографію, дизайн і маркетинг
Про технології, інструменти та "мирний" потенціал
16 липень, 2020
Стати автором

Дипфейки – цифровий візуальний контент, який виглядає настільки реалістично, що його майже не відрізнити від справжніх фотографій або відео. Це технологічне явище з одного боку викликає серйозне занепокоєння, а з іншого — має великий потенціал, для «мирного» застосування в дизайні та мистецтві.

Ця стаття від міжнародного фотобанку Depositphotos, який відстежує тренди, зокрема у галузі глибинного машинного навчання, що можуть вплинути на розвиток фотографії, маркетингу і дизайну.

Штучний інтелект «оживив» Мону Лізу

Що таке дипфейки

Програми, що «зістарюють» обличчя на фото або дозволяють побачити себе у чоловічій чи жіночій версії, фільтри, з якими можна «обмінюватися» обличчями під час селфі, та інші маніпуляції з обличчями реальних людей — це все дипфейки, що останній часом поширились у цифровому середовищі.

Один з перших прикладів дипфейку – зображення принцеси Леї із фільму «Бунтар Один. Зоряні війни. Історія», створене за допомогою накладання моделі обличчя молодої Керрі Фішер на обличчя іншої актриси, яка грала цю роль. Технологія дуже проста. Творці вирізали зображення голови Керрі Фішер із ранніх епізодів «Зоряних воєн» і вставили його у нове відео.

Дипфейк з Керрі Фішер у ролі принцеси Леї із фільму «Бунтар Один. Зоряні війни. Історія»

Ще один показовий випадок використання дипфейків пов’язаний з політикою. Це відео з Бараком Обамою, створене BuzzFeed та коміком Джорданом Пілем, а також відео експрезидента США на основі моделі штучного інтелекту (ШІ), розробленої Університетом Вашингтону.

Відео BuzzFeed з фейковим Бараком Обамою.

Сам термін «дипфейк» походить від назви технології машинного навчання deep learning (глибинного навчання). У ній використовують модель нейронної мережі, яка навчається та вдосконалюється, обробляючи масиви даних. Чим більше даних пройде через нейронну мережу, тим переконливішою буде підробка, створена системою.

Хоча можна підробити й голос (ще один приклад з Бараком Обамою), більшість дипфейків – це фотографії та відео. У 2020 році їхніми героями є переважно публічні особи, політики та зірки. Але також було кілька випадків, коли кіберзлочинці використовували дипфейки із CEO, щоб отримати гроші.

Відео NBC News про ZAO (застосунок для створення дипфейків)

Технологія глибинного навчання несе в собі безмежні можливості для кіновиробництва та освіти, але наразі її використовують для менш високих цілей. Зокрема технології приваблюють в першу чергу мисливців за легкими грошима. Так, нещодавно компанія Deeptrace знайшла в Інтернеті понад 30 000 дипфейк-відео, і близько 96% з них виявилися порнографічними (із зображеннями облич зірок).

Технології, що створюють дипфейки

Технології глибинного навчання, якими ми їх знаємо, презентували у 2017 році. Усе, що існувало до цього моменту (переважно у кінематографі та рекламі), було поєднанням напівавтоматичної постобробки та гарних декорацій. Але дипфейк – це не просто зображення, що реалістично ілюструє подію, якої насправді ніколи не було. Їх особливість у тому, що вони створюються не людиною, а за допомогою алгоритму ШІ — програмою, яка може навчати себе.

Технології на основі кодера

Алгоритм під назвою кодер порівнює два зображення (це можуть бути зображення облич, тіл чи інших об’єктів) і знаходить схожість між ними. Наприклад, на першому зображена людина, яку ви хочете імітувати, а на другому – той, хто буде грати роль цієї людини. Декодер відтворює перший об’єкт із рисами другого.

Основна технологія кодера стала прототипом багатьох алгоритмів для розпізнавання облич та об’єктів, які зараз широко застосовують у соцмережах й інтернет-магазинах.

Інструменти: FaceApp, Doublicat, FakeApp, DeepFaceLab (за допомогою нього створено 95% дипфейк-відео!), Machine Tube

Трансформація обличчя з допомогою FakeApp

Генеративні змагальні мережі (GANs)

Ідея GAN полягає в тому, що вона дозволяє ноутбукам не лише класифікувати зображення, але і створювати їх. GAN – це поєднання двох технологій ШІ: генератора і дискримінатора. Генератор створює зображення, випадково вибираючи в інтернеті елементи різних картинок. Результат генератора не схожий на реальне зображення обличчя або іншого об’єкта, це просто випадковий набір пікселів.

Завдання дискримінатора – відредагувати цей файл, щоб він став подібним до зображень, оброблених ШI (наприклад, фото зірок з Instagram). Такий цикл можна повторити декілька разів, щоб досягти кращого результату. Зокрема отримати зображення предмета, дуже схожого на реальний, але на 100% штучного. GAN також може створювати музику і голоси.

Інструменти на основі GAN: HyperGAN, CycleGAN, RoboCoDraw, pg-GAN (Nvidia)

Підроблена реальність від Nvidia

Дві описані технології також можна поєднувати. Наприклад, зробити реалістичний аватар за допомогою GAN, а потім перетворити його на Instagram-маску і створити відео в режимі реального часу, наче це хтось інший.

Як дипфейки впливають на фотоіндустрію

Розвиток цифрових технологій – природний процес. Не варто його ігнорувати. Краще подумати про можливості, які технології глибинного навчання можуть створити для фотографії як форми мистецтва та бізнес-напряму. Ось кілька ідей від Depositphotos:

Поява нового напряму творчості

Дипфейк-художники вже існують. Один з першопрохідців у цій галузі – Хао Лі. Білл Постерс та Даніель Хоу, які ведуть Instagram-акаунт, присвячений соціальним темам (їхня найвідоміша робота – фальшиве відео з Марком Цукербергом), також називають себе художниками. Чудовим прикладом є роботи Джиліан Веарінг. А у відео Collider здатність дипфейків імітувати реальність використовують як інструмент для критики суспільства у комічний чи саркастичний спосіб.

Відео Collider на YouTube

Художні виставки у будь-якій точці світу

Дипфейки зробили мистецтво фотографії доступнішим. Технології дають можливість відтворити артоб’єкти у будь-якій точці світу, а також роблять можливою глибшу взаємодію між відвідувачами та цифровими предметами мистецтва.

Ви можете створити дипфейк у будь-якій галереї, зімітувавши там персональну виставку. У свою чергу, відвідувачі експозиції можуть взаємодіяти з артоб’єктами чи відчути себе їх частиною з допомогою дипфейк-застосунків.

Дипфейк із Сальвадором Далі у музеї Далі у Флориді. Там художник особисто зустрічає гостей

Професія стає демократичнішою

Не всі фотографи можуть дозволити собі апаратуру вищого класу або послуги професійних моделей для художньої фотосесії. Водночас для цифрових технологій, таких як глибинне навчання, потрібен лише потужний комп’ютер або навіть мобільний телефон. Таким чином, будь-який фотограф може зробити кілька знімків (необов’язково якісних), а потім об’єднати їх, а також використовувати віртуальних персонажів та об’єкти для створення необхідної сцени.

Фотографія переходить на наступний рівень

Фотографи-новачки тепер зможуть швидше вчитися та витрачати менше грошей на освіту, оскільки технології глибинного навчання дозволяють не лише створювати підробки фото, але й вказувати авторам на композиційні помилки, давати їм поради та допомагати покращувати навички. Такі комп’ютерні програми на базі ШI вже є (приклад – інструмент Skylum).

Ще одна можливість для фотографів – продавати мокапи для колекцій дипфейк-фото з обличчям та тілом клієнта.

Фотографи потрібні для створення контенту для навчання ШI

Цілком імовірно, що незабаром з’явиться попит на авторів контенту для тренування ШІ. Технологіям глибинного навчання необхідні зображення, щоб самовдосконалюватися. Чим більше зображень, тим краще. Крім того, для спеціалізованих продуктів на основі ШІ потрібні конкретні зображення (наприклад, зображення здорових та хворих людей для автоматизованої діагностики захворювань). Можливо, на створенні таких фотоданих можна буде заробляти гроші.

Як розвиток дипфек-технологій змінює рекламу

У деяких сферах (таких як судочинство, державна оборона чи журналістика) дипфейки створюють серйозні загрози, тоді як інші (наприклад, маркетинг) можуть мати велику користь від технологій глибинного навчання. Наприклад, зображення на основі ШI дозволяють брендам надавати більш персоналізований досвід користувачам, налагоджувати дружній зв’язок з покупцями, імітуючи персонал компанії у реальному житті, обслуговувати людей на відстані, допомагаючи їм обрати найкращий продукт.

Ефект реальності для кращої реклами та PR

Ця технологія здатна створювати зображення, які стимулюють лояльне ставлення до бренду, коли немає можливості зробити фото. Креативні PR-фахівці використовують її, щоб краще доносити послання бренду. Приклад – соціальна кампанія під назвою Malaria Must Die, де дипфейкова версія Девіда Бекхема говорить про малярію різними мовами. Голоси належать лікарям і людям, які пережили цю хворобу.

Кампанія Malaria Must Die з дипфейковим Девідом Бекхемом.

Імітація володіння продуктом

Маркетологам відомо: вірогідність продажу збільшується, якщо користувачі вже відчули себе власниками продукту. Технологія глибинного навчання допомагає моделювати цю ситуацію. Потенційні покупці косметики побачать, як їхнє обличчя виглядатиме з обраними засобами, а клієнти автосалону — як їм пасує кермо нового автомобіля.

Тестування віртуального макіяжу.

Прогресивна (і дешева) локалізація

Завдяки моделям CGI й правильним місцевим декораціям не потрібно знімати рекламу для кожного локального ринку. Бренди можуть створити єдиний ролик, а потім видаляти та додавати в ньому елементи. Такий підхід дає можливість заощаджувати на виробництві.

Глибинне навчання та дизайн

З технологіями глибинного навчання з’являються принципово нові підходи у створенні фотореалістичних зображень, персонажної анімації у комп’ютерних іграх, дизайну сайтів та інших напрямах. Й хоча наразі результати не завжди досконалі, алгоритми мають великий потенціал у цій сфері, особливо коли мова йде про роботу живого дизайнера й ШІ у парі.

Створення картинки з допомогою тексту

Розробка Microsoft Drawing Bot доводить, що зображення можна не малювати, а прописати. Вона вміє генерувати картинки із самого лише тексту. Причому слів «жовте тіло, чорні крила і короткий дзьоб» достатньо, щоб отримати обриси птаха. Більш того, зображення матиме деталі, яких не було в описі. Це свідчить про те, що у Drawing Bot є не лише штучний інтелект, але й штучна уява. Результат його роботи виглядає настільки правдоподібно, що його можна легко сплутати зі справжнім зображенням. Завдяки таким технологіям можна швидко отримати повну візуалізацію будь-якого об’єкту.

Відео про Drawing Bot від Microsoft.

Реалістичні зображення з простих начерків

Ще один революційний продукт від NVIDIA на основі технології глибинного навчання – програма GauGAN, названа на честь Поля Гогена (Paul Gaugain). Її алгоритм перетворює абстрактні лінії у дипфейк-зображення. Нейромережа, яка опрацювала понад мільйон стокових фотографій (переважно пейзажів), легко відтворює різні форми ландшафту. Потенційно GauGAN – чудовий помічник для архітекторів і дизайнерів, який суттєво спростить візуалізацію проєктів і дозволить отримувати фотореалістичні картинки.

Як працює інструмент GauGAN.

Доступний дизайн сайтів

Приклад популярної розробки на базі ШІ у сфері дизайну – конструктори сайтів на кшталт WIX. Компанія активно впроваджує функції на основі алгоритмів. З технологією Advanced Design Intelligence навіть непрофесіонал може розробити сайт. Алгоритм навчався, аналізуючи безліч гарних прикладів сучасних сайтів. Крім того, конструктор пропонує персоналізований досвід, даючи стилістичні поради з огляду на напрям діяльності клієнта.

Технологія інтелектуального дизайну від WIX    

До ШІ можна ставитися по-різному – остерігатися або захоплюватися, але не можна ігнорувати той факт, що він докорінно змінює звичні речі й змушує переосмислити сучасну роль багатьох спеціалістів, зокрема дизайнерів.

Як би не лякало те, що звичайна людина не може відрізнити високоякісний дипфейк від справжнього зображення, технології, які дозволили втілити це, вивели фотографію, маркетинг і дизайн на новий рівень якості й можливостей.

У нас є ще дещо для вас