Компанія Google презентувала нову технологію штучного інтелекту під назвою Gemini Omni, яка обіцяє революціонізувати спосіб, у який користувачі взаємодіють з інформацією в Інтернеті. Ця система здатна одночасно аналізувати текстову та аудіовізуальну інформацію, що відкриває нові горизонти для пошукових запитів і контенту. Gemini Omni інтегрує можливості розпізнавання образів, звуку та природної мови, дозволяючи користувачам отримувати відповіді на запитання не лише через текст
Ілюстрація: Copilot для pravdatutnews.com
Тепер пошук працює як інтерактивний асистент, який бачить, чує й відповідає в реальному часі, поєднуючи текст, голос, відео та зображення.
Google представила Gemini Omni якуніверсальну платформу, що інтегрує штучний інтелект у всі сервіси компанії — від пошуку до Gmail, YouTube і Maps.
Новий пошук тепер розуміє контекст запиту, може аналізувати відео чи фото, розпізнавати об’єкти й одразу давати усні або текстові відповіді.
Інтерфейс Omni дозволяє користувачу спілкуватися з пошуком голосом, показувати зображення або навіть короткі відео — система реагує миттєво, як людина.
Швидкість відповіді зросла у кілька разів завдяки оптимізованій моделі Gemini 1.5 Pro, яка працює на власних чипах TPU v6.
Google називає це «пошуком нового покоління», де результати не просто видаються списком, а формуються як інтерактивна розмова.
Omni може аналізувати відео з YouTube, витягувати ключові моменти, створювати резюме або пояснення.
У мобільній версії користувач може запитати голосом, показати фото продукту чи місця — і отримати відповідь у форматі відео або короткої анімації.
Пошук теперпідтримує багатомовність у реальному часі:запит українською може дати відповідь англійською або навпаки.
Gmail:автоматичне створення відповідей на листи з урахуванням контексту.
Docs і Sheets: генерація текстів, таблиць і звітів за голосовими командами.
Maps: розпізнавання відео з камер і побудова маршрутів у реальному часі.
YouTube:інтерактивні підказки під відео,можливість ставити запитання прямо під час перегляду.
Але, мабуть, найважливіша частина оновлення —ШІ-агенти.Google показав автономних агентів на базі Gemini, здатних безперервно моніторити інформацію і діяти від імені користувача: відстежувати ціни на авіаквитки, слідкувати за спортивними результатами, моніторити теми для оновлень, організовувати електронну пошту і надсилати проактивні сповіщення.
Запуск Gemini Omni — це відповідь Google на стрімке зростання конкурентів у сфері генеративного ШІ, насамперед OpenAI та Microsoft. Компанія робитьставку на мультимодальність — здатність системи працювати з будь-яким типом даних.Аналітики вже називають Omni «новим етапом еволюції пошуку», який може повністю змінити спосіб взаємодії людей з інформацією.
AI Mode, раніше доступний у обмеженій формі, тепер розгортається якповноцінний мультимодальний пошуковий помічник на базі Gemini 3.5 Flash. Користувачі можуть задавати довші та детальніші запити, завантажувати скриншоти, PDF-файли, фотографії та відео безпосередньо у пошук і продовжувати розмову з контекстуальними уточненнями.
Чи не найважливіша частина оновлення — ШІ-агенти.
Юрій Никорак,pravdatutnews.com
Джерела
Gemini Omni бачить, чує й створює одразу усе: Google змінила уявлення про пошук — (Pravdatutnews)