Amazon Polly

Transforma el texto en habla realista, con aprendizaje profundo.

¿Qué es Amazon Polly?

 Es un servicio que transforma texto en habla realista; te permite crear aplicaciones que hablan y crear nuevas categorías de productos con habla. Polly es un servicio de Amazon AI que utiliza tecnologías de aprendizaje profundo avanzadas para sintetizar habla que se asemeja a una voz humana; incluye 47 voces realistas en 24 idiomas, de modo que puedes seleccionar la voz ideal y crear aplicaciones con habla aptas para numerosos países distintos. Amazon Polly proporciona los tiempos de respuesta rápidos necesarios para respaldar el diálogo interactivo en tiempo real; puedes almacenar en caché y guardar el habla para reproducirlo offline o redistribuirlo, y además, es sencillo de utilizar.

 

 

Beneficios

  • Voces con un sonido natural. 47 voces realistas y compatibles con 24 idiomas, incluyendo amplias voces masculinas y femeninas en diversos acentos; la pronunciación fluida te permite entregar voz de alta calidad y crear aplicaciones para usuarios globales.
  • Almacena y redistribuye el habla.  La capacidad de reproducirlo todas las veces que desees, sin cuotas adicionales.
  • Interacción sencilla. Facilita la incorporación de voz en tu sitio web, aplicación móvil o dispositivo; solo tienes que escribir el texto que deseas convertir a habla en la API de Polly y recibirás al instante la transmisión de audio. 
  • Respuesta rápida. Aplicaciones que proporcionan indicaciones de voz sobre cómo encontrar un lugar, de aprendizaje electrónico que proporcionan instrucciones verbales a los alumnos y que interactúan con los usuarios mediante el diálogo en tiempo real.
  • Bajo costo. Una manera rentable de habilitar la síntesis del habla en prácticamente cualquier aplicación.

     

     

Casos de uso

  • Creación de contenido. Te facilita la incorporación de habla a tu vídeo, presentación o curso de formación online; puedes generar habla en 24 idiomas, resultándote sencillo añadir voces a aplicaciones con una audiencia global. Puedes leer tu fuente RSS, noticias o correo electrónico y almacenar el habla sintetizada en formato de archivos de audio.
  • Centro de asistencia al cliente. Tus centros de atención pueden responder con voces con un sonido natural; puedes reproducir el habla de salida mediante tus sistemas de respuesta de voz interactiva (IVR, por sus siglas en inglés). Además, puedes proporcionar información automatizada en tiempo real.
  • Internet de las cosas. Te facilita nuevos casos de uso del Internet de las cosas (IoT, por sus siglas en inglés) al hacer que resulte sencillo y económico añadir habla a dispositivos IoT; pueden dar respuestas y notificaciones naturales, hacer que las aplicaciones sean más accesibles, y dar información sin tener que depender de una pantalla. 
  • Aprendizaje de idiomas. Puedes mejorar la capacidad de uso de aplicaciones que enseñan a los usuarios a hablar otros idiomas; por ejemplo, los usuarios finales pueden escribir frases en otros idiomas en tu aplicación y escuchar cómo las pronuncia un hablante nativo.
  • Accesibilidad. Puedes crear y distribuir información accesible en formato de habla sintetizada para personas con discapacidades visuales; de este modo, puedes ayudar a aquellos con problemas de visión a utilizar contenido, como noticias, libros o mensajes de correo electrónico.

Nuevo llamado a la acción

Solicita tu cotización

Nuevo llamado a la acción