Google запускає Gemini 3.5 Live Translate: переклад голосу в реальному часі
Нова модель ШІ підтримує понад 70 мов, зберігає інтонацію голосу та працює з мінімальною затримкою навіть у шумному середовищі.
Google представила модель Gemini 3.5 Live Translate — технологію для голосового перекладу в реальному часі. Система розпізнає понад 70 мов і зберігає природні характеристики голосу: темп, висоту та інтонацію.
Що вміє нова технологія
- Перекладає мову безперервно в потоковому режимі;
- Затримка становить лише кілька секунд;
- Працює в шумному середовищі без додаткового налаштування;
- Зберігає природне звучання голосу;
- Має захист від зловживань завдяки цифровому водяному знаку SynthID.
Де вже доступна
Для розробників:
- Через Gemini Live API та Google AI Studio (публічна попередня версія);
- Інтегрується з платформами Agora, LiveKit та Vision Agents;
- Тестується сервісом Grab для дзвінків.
Для бізнесу:
- У Google Meet (закрите тестування);
- Підтримка понад 2000 мовних комбінацій;
- Повноцінний запуск — наприкінці 2026 року.
Для звичайних користувачів:
- Оновлення в застосунку Google Translate для iOS та Android;
- Підтримка навушників;
- Режим прослуховування на Android.