Google представила систему нового поколения для преобразования
текста в речь. Система называется Tacotron 2 и основывается на искусственном
интеллекте из двух нейронных сетей. Первая нейросеть преобразуют текст в
специальную спектрограмму, вторая читает эту диаграмму и преобразует в голос. В
результате получается речь неотличимая от голоса реального человек.Система уже внедряется для генерации более реалистичного
голоса в Google Assistant, но ещё требует полировки.
Сравните голос реального человека и голос искусственного интеллекта (“That girl did a video about Star Wars lipstick.”)
По-моему, искусственный интеллект научился читать текст лучше человека)