Ciencia y Tecnología

Google crea una voz sintética casi idéntica a la generada por humanos

Google puso a disposición las pistas de audio generadas de forma sintética con sus redes de inteligencia artificial

Google

AFP

 La nueva aplicación de Google será del tipo foto - colaborativa

Por LA NACIÓN | ARGENTINA | GDA

Al momento, las voces utilizadas por los asistentes virtuales disponibles en el mercado aún pueden sonar artificiales. Sin embargo, Google acaba de presentar una investigación donde asegura que pudo crear un sistema de lectura de texto a voz que tiene la virtud de imitar la entonación humana. 

Denominado Tacotron 2, es la segunda generación de una tecnología desarrollada por Google, cuyo funcionamiento está basado en dos redes neuronales que interpretan el texto y aplican los efectos, pausas y entonaciones presentes en el documento junto a WaveNet, el software responsable de generar las voces de Google Assistant.

Entre las características más destacadas de Tacotron 2 está la capacidad de pronunciar nombres y palabras, distinguir signos de puntuación o si una parte del texto requiere ser remarcada con una entonación más destacada. 

De hecho, Google puso a disposición las pistas de audio generadas de forma sintética con sus redes de inteligencia artificial junto a otras pistas relatadas por humanos, con un desempeño perfecto con palabras y frases complejas.

Por el momento Tacotron 2 se encuentra en una etapa de evaluación, disponible sólo en inglés y con una voz femenina, aunque se espera que Google lo lanzará en otros formatos, con una versión masculina y en otros idiomas. De esta forma, la compañía de Internet planea en el corto plazo perfeccionar aún más los sistemas guiados por voz como Assistant.