Gemini Omni бачить, чує й створює одразу усе: Google змінила уявлення про пошук

Компанія Google презентувала нову технологію штучного інтелекту під назвою Gemini Omni, яка обіцяє революціонізувати спосіб, у який користувачі взаємодіють з інформацією в Інтернеті. Ця система здатна одночасно аналізувати текстову та аудіовізуальну інформацію, що відкриває нові горизонти для пошукових запитів і контенту. Gemini Omni інтегрує можливості розпізнавання образів, звуку та природної мови, дозволяючи користувачам отримувати відповіді на запитання не лише через текст

Ілюстрація: Copilot для pravdatutnews.com

Тепер пошук працює як інтерактивний асистент, який бачить, чує й відповідає в реальному часі, поєднуючи текст, голос, відео та зображення.

Google представила Gemini Omni якуніверсальну платформу, що інтегрує штучний інтелект у всі сервіси компанії — від пошуку до Gmail, YouTube і Maps.

Новий пошук тепер розуміє контекст запиту, може аналізувати відео чи фото, розпізнавати об’єкти й одразу давати усні або текстові відповіді.

Інтерфейс Omni дозволяє користувачу спілкуватися з пошуком голосом, показувати зображення або навіть короткі відео — система реагує миттєво, як людина.

Швидкість відповіді зросла у кілька разів завдяки оптимізованій моделі Gemini 1.5 Pro, яка працює на власних чипах TPU v6.

Google називає це «пошуком нового покоління», де результати не просто видаються списком, а формуються як інтерактивна розмова.

Omni може аналізувати відео з YouTube, витягувати ключові моменти, створювати резюме або пояснення.

У мобільній версії користувач може запитати голосом, показати фото продукту чи місця — і отримати відповідь у форматі відео або короткої анімації.

Пошук теперпідтримує багатомовність у реальному часі:запит українською може дати відповідь англійською або навпаки.

Gmail:автоматичне створення відповідей на листи з урахуванням контексту.

Docs і Sheets: генерація текстів, таблиць і звітів за голосовими командами.

Maps: розпізнавання відео з камер і побудова маршрутів у реальному часі.

YouTube:інтерактивні підказки під відео,можливість ставити запитання прямо під час перегляду.

Але, мабуть, найважливіша частина оновлення —ШІ-агенти.Google показав автономних агентів на базі Gemini, здатних безперервно моніторити інформацію і діяти від імені користувача: відстежувати ціни на авіаквитки, слідкувати за спортивними результатами, моніторити теми для оновлень, організовувати електронну пошту і надсилати проактивні сповіщення.

Запуск Gemini Omni — це відповідь Google на стрімке зростання конкурентів у сфері генеративного ШІ, насамперед OpenAI та Microsoft. Компанія робитьставку на мультимодальність — здатність системи працювати з будь-яким типом даних.Аналітики вже називають Omni «новим етапом еволюції пошуку», який може повністю змінити спосіб взаємодії людей з інформацією.

AI Mode, раніше доступний у обмеженій формі, тепер розгортається якповноцінний мультимодальний пошуковий помічник на базі Gemini 3.5 Flash. Користувачі можуть задавати довші та детальніші запити, завантажувати скриншоти, PDF-файли, фотографії та відео безпосередньо у пошук і продовжувати розмову з контекстуальними уточненнями.

Чи не найважливіша частина оновлення — ШІ-агенти.

Юрій Никорак,pravdatutnews.com

Джерела

Gemini Omni бачить, чує й створює одразу усе: Google змінила уявлення про пошук — (Pravdatutnews)

Всі новини: Наука та технології