Whisk — це експеримент Google зі штучним інтелектом, який не потребує слів для підказок, він використовує зображення як підказки. За допомогою Whisk ви можете взяти, наприклад, своє фото та розмістити себе у якихось фантастичних декораціях. Запропонувати те, що ви хотіли б як об’єкт, сцену та стиль фінального твору, ви можете за допомогою кількох зображень для кожної з цих трьох речей.
Якщо у вас під рукою немає зображень, ви можете клацнути піктограму кубика, щоб Google заповнив деякі зображення для підказок. Ви також можете ввести текст у текстове поле наприкінці процесу, якщо ви хочете додати додаткові деталі про зображення, але це не обов’язково.
Тоді Whisk створить зображення та текстову підказку для кожного зображення. Ви можете додати ще зображення або завантажити отримане, якщо ви задоволені результатами.
У дописі в блозі Google підкреслює, що Whisk призначений для швидкого візуального дослідження, а не для ідеального піксельного редагування. Компанія також каже, що Whisk може «промахнутися», тому він дозволяє редагувати базові підказки.
Google каже, що Whisk використовує останню ітерацію своєї моделі генерації зображень Imagen 3. Google також представила Veo 2, наступну версію своєї моделі генерації відео, яка, за словами компанії, розуміє унікальну мову кінематографа та галюцинує такі баги, як додаткові пальці, рідше, ніж інші моделі.
Veo 2 з’являється першим у Google VideoFX, який ви можете отримати в списку очікування Google Labs, і він буде розширений до YouTube Shorts десь наступного року.
The post ШІ Google Whisk генерує зображення на основі інших зображень appeared first on .