Синтез речи из текста переходит от TTS-систем к LLM и нейросетевым кодекам
Синтез речи переживает революцию: сложные архитектуры TTS уступают место простой связке языковой модели и нейросетевого кодека. Новый подход обеспечивает высокое качество, масштабируемость и мультимодальность.
