ИИ учится переводить речь на язык жестов и обратно

ИИ учится переводить речь на язык жестов и обратно.


Китайский стартап Limitless Mind разрабатывает систему перевода между устной речью и языком жестов. Компактная модель предназначена для умных гаджетов, включая очки и смартфоны, чтобы обеспечить коммуникацию между глухими и слышащими без необходимости специального обучения. На данный момент проект находится на этапе разработки прототипа и активно ищет финансирование.

Несмотря на наличие технологий для преобразования речи в текст, многие люди с нарушениями слуха не обладают навыками чтения. Для них жестовый язык является естественным и понятным способом общения. Жесты могут варьироваться даже в пределах одной страны, как диалекты языка. Для понимания важны не только движения рук, но и выражение лица, наклон головы и скорость жестов.

Исследователи собрали около 12 тысяч размеченных видеозаписей, охватывающих различные «диалекты». В этих видеозаписях зафиксированы 3D-координаты движений рук, тела и мимики. Модель была обучена на основе предоставленных данных для распознавания жестов на видео и их преобразования в текст, а также для обратного преобразования текста или речи в жесты виртуального трёхмерного аватара.

Существуют и другие системы искусственного интеллекта для сурдоперевода, помимо Limitless Mind. Например, китайские компании Baidu и Alibaba уже разработали свои облачные решения в этой области. Для американского языка жестов компания Google выпустила модель SignGemma.

Источник
 
Назад
Сверху Снизу