Google запустила Gemini Omni: ШІ для “створення чого завгодно з будь-чого”

Компанія Google оголосила про запуск нового штучного інтелекту Gemini Omni, який обіцяє революціонізувати процес створення контенту. Ця технологія здатна генерувати різноманітний цифровий матеріал, включаючи текст, зображення та відео, на основі простих запитів користувачів. За словами розробників, Gemini Omni може перетворювати ідеї в готові продукти лише за кілька хвилин. Основною метою цього проекту є спростити творчу діяльність для професіоналів у різних сферах — від маркетингу до мистецтва. Інтер

Компанія Google презентувала нову мультимодальну модель штучного інтелекту Gemini Omni, здатну створювати відео з будь-якої комбінації вхідних даних. Першою моделлю в новій групі сталаGemini Omni Flash, яку вже почали інтегрувати в застосунок Gemini, сервіс Google Flow та YouTube Shorts.

Як заявили в Google, Gemini Omni може "створювати що завгодно з будь-чого", зокрема поєднує можливості міркування ШІ Gemini зі здатністю генерувати та редагувати контент на основі тексту, зображень, аудіо й відео. У компанії наголосили, що модель здатна змінювати окремі об’єкти, середовище, стиль або рух без втрати контексту початкового ролика.

Gemini Omni також отримала покращене розуміння фізичних процесів. У компанії заявили, що система краще працює з моделюванням гравітації, кінетичної енергії та гідродинаміки, що дозволяє створювати більш реалістичні сцени.

ВАС ЗАЦІКАВИТЬGoogle оновлює Workspace: ШІ стане офісним помічником

Окремо Google акцентує на здатності Omni поєднувати творчість зі знаннями Gemini у сфері науки, історії та культури. Модель може генерувати складні пояснювальні відео, зокрема наукові візуалізації або освітні ролики, на основі коротких текстових запитів.

Система підтримує комбінування різних типів контенту в одному проєкті. Користувачі можуть завантажувати зображення, відео, текстові описи або аудіофайли, а Omni створюватиме єдиний відеокліп із синхронізованими ефектами та стилістикою.

У Google також представили функцію Avatars, яка дозволяє створювати цифрового аватара з власним голосом та зовнішністю. Компанія зазначає, що наразі продовжує тестування функцій зміни голосу та мови для безпечного використання технології.

ВАС ЗАЦІКАВИТЬGoogle презентувала Googlebook: ноутбуки, побудовані навколо штучного інтелекту

Всі відео, створені через Gemini Omni, автоматично отримуватимуть цифровий водяний знак SynthID. У Google заявили, що контент можна буде перевірити через Gemini, Chrome та пошук Google.

Gemini Omni Flash вже почали розгортати для передплатників Google AI Plus, Pro та Ultra по всьому світу. Також модель стане доступною безплатно в YouTube Shorts і застосунку YouTube Create. У найближчі тижні Google планує відкрити доступ до Omni через API для розробників і корпоративних клієнтів.

ВодночасGoogle представила масштабне оновлення Пошуку(Search) із новими функціями штучного інтелекту та агентними можливостями. Відтепер режим AI Mode працюватиме на базі моделі Gemini 3.5 Flash, яка стане моделлю за замовчуванням для користувачів у всьому світі.

Джерела

Google запустила Gemini Omni: ШІ для “створення чого завгодно з будь-чого” — (ZN,ua)

Всі новини: Наука та технології