28 декабря 2017 г.

Новое поколение систем преобразования текста в речь


Google представила систему нового поколения для преобразования текста в речь. Система называется Tacotron 2 и основывается на искусственном интеллекте из двух нейронных сетей. Первая нейросеть преобразуют текст в специальную спектрограмму, вторая читает эту диаграмму и преобразует в голос. В результате получается речь неотличимая от голоса реального человек.Система уже внедряется для генерации более реалистичного голоса в Google Assistant, но ещё требует полировки.

Сравните голос реального человека и голос искусственного интеллекта (“That girl did a video about Star Wars lipstick.”) По-моему, искусственный интеллект научился читать текст лучше человека)

Комментариев нет:

Отправить комментарий