Google представила Gemini Omni — ШІ для створення та редагування реалістичних відео

Компанія Google анонсувала нову платформу штучного інтелекту під назвою Gemini Omni, яка обіцяє революціонізувати процес створення та редагування відео. Цей інноваційний продукт дозволяє користувачам генерувати реалістичні відеоматеріали лише за допомогою текстових запитів, що значно спрощує творчий процес для контент-креаторів. Gemini Omni інтегрує передові алгоритми машинного навчання, які аналізують вхідні дані і перетворюють їх на високоякісне відео з урахуванням усіх

Компанія Google офіційно анонсувала нову мультимодальну модель Gemini Omni, яка здатна генерувати реалістичні відео та редагувати їх за допомогою звичайних текстових команд. Першою користувачам стала доступна полегшена версія — Omni Flash, яку вже інтегрували у застосунок Gemini та платформу YouTube Shorts.

Нова технологія поєднує можливості одразу кількох ШІ-рішень Google, включаючи Gemini Nano, Veo та Genie. Завдяки цьому система може створювати відео не лише з текстового опису, а й на основі фотографій, ескізів, зображень або навіть коротких сценаріїв.

У Google наголошують, що Gemini Omni краще розуміє фізику навколишнього світу. Модель враховує закони гравітації, інерцію, поведінку об’єктів під час руху та взаємодію персонажів із середовищем. Саме це дозволяє створювати ролики, які виглядають значно природніше порівняно з багатьма сучасними генераторами відео.

Однією з ключових особливостей Gemini Omni стала можливість змінювати вже готові відеоролики через текстові запити. Користувачу достатньо описати потрібну зміну природною мовою — наприклад, змінити погоду, додати певний об’єкт або скоригувати стиль сцени.

При цьому модель аналізує контекст відео та вносить лише необхідні правки. Персонажі, композиція кадру та інші об’єкти залишаються незмінними, якщо користувач не попросив інакше. Такий підхід дозволяє уникнути типової проблеми генеративних моделей, коли після редагування сцени повністю змінюються деталі або зовнішність героїв.

Фактично Google робить ще один крок до формату «розмовного монтажу», де користувачеві більше не потрібні складні відеоредактори або професійні навички роботи з графікою.

Запуск Gemini Omni демонструє, що Google серйозно посилює конкуренцію на ринку генеративного відео, де вже активно розвиваються рішення від OpenAI, Runway та інших компаній. Особливо важливим виглядає акцент саме на інтеграції з YouTube Shorts — це може суттєво прискорити масове використання AI-інструментів серед авторів контенту.

Аналітики індустрії звертають увагу, що Google робить ставку не лише на якість генерації, а й на швидкість роботи та доступність для звичайних користувачів. Omni Flash позиціонується як легша та швидша модель, яку можна використовувати прямо у мобільних сервісах без складного налаштування.

Окремий інтерес викликає здатність Gemini Omni працювати одразу з кількома типами контенту — текстом, зображеннями та відео. Саме мультимодальність зараз вважається одним із головних напрямків розвитку сучасного штучного інтелекту.

На даний момент Gemini Omni Flash уже почала з’являтися у застосунку Gemini, а також серед інструментів для творців YouTube Shorts. Очікується, що надалі Google розширить функціональність моделі та відкриє доступ до повноцінної версії Omni з більш просунутими можливостями генерації та редагування відео.

Джерела

Google представила Gemini Omni — ШІ для створення та редагування реалістичних відео — (iLenta)

Всі новини: Наука та технології