Переводчик Google научился говорить голосом пользователя

Большинство текущих методов голосового перевода основано на преобразовании речи в текст и обратно, что нередко приводит к ошибкам и даже искажению смысла произнесённой фразы. Компания Google представила оригинальную технологию, которая способна напрямую преобразовывать речь с одного языка на другой, сохраняя при этом интонацию и частоту речи говорящего.

Новый метод перевода под названием Translatotron использует сетевую модель, которая обрабатывает голос пользователя как спектрограмму (визуальное представление частот) и генерирует новую спектрограмму на целевом языке. В результате такой операции скорость и точность перевода значительно увеличиваются.

Инструмент также способен распознавать особенности тембра и интонации говорящего и «переложить» их на другой язык, отчасти имитируя акцент и скорость речи оригинала. Несмотря на некоторую «роботизированность», в некоторых случаях компьютерный голос звучит весьма правдоподобно. Прослушать образцы такого перевода можно на странице официального блога Google.

Ранее компания представила в Google Translate функцию имитации акцентов с поддержкой особенностей произношения пользователей различных регионов. произношением по регионам, и добавила дополнительные языки к своей функции перевода в реальном времени. В 2019-м голосовой помощник Google Assistant также получил «режим переводчика» для 26 языков.

Источник: 4PDA

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *