- 30 Апр 2025
- 2 165
Google представила Gemini 3.5 Live Translate - новую модель искусственного интеллекта, предназначенную для синхронного перевода речи в реальном времени. В чем ее особенность?
В отличие от классических систем, которые ждут окончания фразы спикера, новая модель переводит непрерывно и без пауз. Технология поддерживает более 70 языков, включая русский, и, по словам компании, полностью сохраняет интонацию, темп и высоту голоса говорящего, делая общение максимально естественным.
В iOS и Android новая функция активируется кнопкой в левом нижнем углу экрана при подключенных наушниках. Владельцам андроид-смартфонов доступен дополнительный режим «телефонного звонка» - перевод можно слушать через динамик, просто поднеся смартфон к уху.
С интеграцией Gemini 3.5 пользователям Google Meet стало доступно более 2000 языковых комбинаций. Ранее конференции переводились только с и на английский язык. В целях безопасности и борьбы с дезинформацией Google внедрила в технологию защитные механизмы. Весь генерируемый аудиоконтент маркируется невидимой цифровой меткой SynthID, которая позволяет однозначно идентифицировать, что голос был создан искусственным интеллектом.
Функция уже постепенно раскатывается для пользователей Android и iOS, поэтому пока еще не всем доступна. Публичная версия Gemini 3.5 Live Translate для разработчиков доступна через Gemini Live API и Google AI Studio.