Google запускает Gemini 3.5 Live Translate: перевод голоса в реальном времени

Новая модель ИИ поддерживает более 70 языков, сохраняет интонацию голоса и работает с минимальной задержкой даже в шумной среде.

Google представила модель Gemini 3.5 Live Translate – технологию для голосового перевода в реальном времени. Система распознает более 70 языков и сохраняет естественные свойства голоса: темп, высоту и интонацию.

Что умеет новая технология

  • Перевод языка непрерывно в потоковом режиме;
  • Задержка составляет всего несколько секунд;
  • Работает в шумной среде без дополнительной настройки;
  • Сохраняет естественное звучание голоса;
  • Имеет защиту от злоупотреблений благодаря цифровому водяному знаку SynthID.

Где уже доступна

Для разработчиков:

  • Через Gemini Live API и Google AI Studio (публичная предварительная версия);
  • Интегрируется в платформы Agora, LiveKit и Vision Agents;
  • Тестируется сервисом Grab для звонков.

Для бизнеса:

  • В Google Meet (закрытое тестирование);
  • Поддержка более 2000 языковых комбинаций;
  • Полноценный запуск – в конце 2026 года.

Для обычных пользователей:

  • Обновления в Google Translate для iOS и Android;
  • Поддержка наушников;
  • Режим прослушивания для Android.
Читайте также