Características de Amazon Transcribe

¿Por qué Amazon Transcribe?

Amazon Transcribe es un servicio de reconocimiento automático de voz que facilita la incorporación de funciones de conversión de voz a texto en cualquier aplicación. Las características de Transcribe le permiten ingerir entradas de audio, producir transcripciones fáciles de leer y revisar, mejorar la precisión con la personalización y filtrar el contenido para garantizar la privacidad de los clientes.

Entradas de audio

Transcribe está diseñado para procesar entradas de audio o video en directo y grabadas a fin de proporcionar transcripciones de alta calidad para la búsqueda y el análisis. También ofrecemos API independientes que comprenden exclusivamente las llamadas de los clientes (Amazon Transcribe Call Analytics) y las conversaciones médicas (Amazon Transcribe Medical).

Entradas de audio

Transcripciones fáciles de leer

Amazon Transcribe le permite producir transcripciones precisas que son fáciles de leer, revisar e integrar en sus aplicaciones específicas. Trabajamos para preparar el resultado para actividades posteriores, como el análisis de transcripciones de llamadas, la subtitulación y la búsqueda de contenido.

Transcripciones fáciles de leer

Personalice su salida

La precisión es fundamental y le ofrecemos muchas opciones para personalizar las transcripciones según sus necesidades empresariales específicas y su lengua vernácula. Transcribe también ofrece hasta 10 transcripciones alternativas para cada oración, de modo que puedas elegir rápidamente la mejor opción que se adapte a tu contenido y dominio. Esto es útil para los flujos de trabajo de subtitulación continua humanos.

Personalice su salida

Características de seguridad y privacidad del usuario

Garantizar la privacidad y la seguridad de los clientes es fundamental. Cuando sea necesario, Transcribe puede ayudarlo a enmascarar o eliminar palabras delicadas o inadecuadas para su audiencia de los resultados de la transcripción.

Características de seguridad y privacidad del usuario

Mejore la productividad del centro de contacto con la integración generativa de llamadas

Cree automáticamente resúmenes de llamadas impulsados por IA generativa para ayudar a los agentes a centrarse en ofrecer excelentes experiencias a los clientes y aumente la productividad al eliminar el trabajo posterior a la llamada. Los encargados pueden revisar rápidamente estos resúmenes, sin necesidad de revisar toda la transcripción para comprender el contexto de una interacción e investigar cualquier problema del cliente.

Amazon Transcribe Call Analytics

Entradas de Audio

Puede procesar sus grabaciones de audio existentes o transmitir el audio para su transcripción en tiempo real. Mediante una conexión segura, puede enviar una secuencia de audio en vivo al servicio, y recibirá como respuesta una secuencia de texto en tiempo real.

Seleccione un modelo que esté ajustado para llamadas telefónicas o contenido de video multimedia. Por ejemplo, Transcribe se adapta al audio telefónico de baja fidelidad común en los centros de contacto.

Con Amazon Transcribe, puede identificar automáticamente los idiomas hablados en un archivo de audio o contenido multimedia en streaming sin especificar un código de idioma. Amazon Transcribe identificará el idioma dominante hablado o, si el audio contiene varios idiomas, puede identificar todos los idiomas hablados y transcribir el discurso en consecuencia. Esto es útil cuando sus clientes cambian de idioma o si su biblioteca multimedia contiene archivos de audio en diferentes idiomas. También puede usar esta característica para clasificar el contenido multimedia y comprobar que el idioma principal hablado en sus videos y podcasts esté etiquetado correctamente.

Transcripciones fáciles de leer

Amazon Transcribe agrega automáticamente signos de puntuación y formato de números, de modo que el resultado tenga la calidad de una transcripción manual, pero con una inversión de tiempo y dinero mucho menor. Los números también se transcriben en dígitos o en “forma normal” en lugar de palabras.

Amazon Transcribe devuelve una marca temporal por cada palabra, lo que le permite localizar fácilmente una palabra o frase en la grabación original o añadir subtítulos a un vídeo.

Los cambios de oradores se reconocen automáticamente y se atribuyen en el texto para identificar con precisión casos de uso como llamadas telefónicas, reuniones y programas de televisión. Para obtener más información sobre la identificación de hablantes.

Los centros de contacto pueden enviar un solo archivo de audio a Amazon Transcribe y el servicio lo identificará al instante, y luego de forma automática, elaborará una sola transcripción con comentarios según las etiquetas de los canales.

Personalización

Con la opción devocabulario personalizado puede agregar nuevas palabras al vocabulario base y generar transcripciones más precisas para palabras y frases de un determinado dominio, como nombres de productos, terminología técnica o nombres de personas.

Cuando sea necesario, puede crear y capacitar su propio modelo de lenguaje personalizado (CLM) para su caso de uso y dominio mediante el envío de un corpus de datos de texto a Amazon Transcribe. El CLM es una característica adecuada para mejorar la precisión del reconocimiento de voz con sus propios datos.

Privacidad y seguridad

Puede establecer una lista de palabras que se deben eliminar de las transcripciones con la opción de filtrado de vocabulario. Por ejemplo, puede especificar una lista de palabras profanas u ofensivas y Amazon Transcribe las eliminará de las transcripciones de forma automática.

Proteja los datos en reposo con la clave Amazon S3 (SSE-S3) o establezca su propia clave de AWS Key Management Service. Amazon Transcribe utiliza TLS (Transport Layer Security) 1.2, un protocolo criptográfico que permite conexiones autenticadas y el transporte seguro de datos a través de Internet mediante HTTP, con certificaciones de AWS para cifrar los datos en tránsito. Esto incluye la transmisión de transcripciones. 

Cuando se le indique, Amazon Transcribe puede ayudar a los clientes identificar y censurar información de identificación personal (PII) de las transcripciones de idiomas disponibles. Esto les permite a los centros de atención examinar y compartir con facilidad las transcripciones de la información de la experiencia del cliente y la formación técnica del agente.

Amazon Transcribe Toxicity Detection utiliza machine learning para mantener conversaciones de audio civilizadas y constructivas a fin de fomentar un entorno en línea seguro e inclusivo. El contenido de audio tóxico se clasifica en una de varias categorías para que los moderadores humanos lo identifiquen fácilmente y tomen las medidas adecuadas. 

Transcribe Call Analytics

Genere resúmenes de llamadas para que los agentes se puedan enfocar en brindar excelentes experiencias a los clientes y aumentar la productividad posterior a la llamada, al capturar automáticamente las partes clave de la conversación con el cliente (como problemas, resultados o elementos de acción). Los encargados pueden revisar rápidamente estos resúmenes, sin necesidad de revisar toda la transcripción para comprender el contexto de una interacción e investigar cualquier problema del cliente.

Gracias a las posibilidades que ofrece el machine learning, podrá aplicar rápidamente las capacidades de conversión de voz a texto y procesamiento de lenguaje natural (NLP) durante las llamadas en directo y obtener información valiosa de la conversación. Así podrá integrar en las aplicaciones de análisis de llamadas entrantes y salientes datos, como la opinión de los clientes y los agentes, los problemas detectados y las características de la conversación, como el tiempo sin hablar, las interrupciones y la velocidad de conversación. Esto puede ayudar a los supervisores a identificar más fácilmente posibles problemas que tengan los clientes, oportunidades de formación para los agentes y tendencias de las llamadas.

Supervise las llamadas a escala para realizar un seguimiento del cumplimiento de las políticas de la empresa o de los requisitos regulatorios. Cree y entrene categorías personalizadas propias en función de criterios que especifique (como palabras/frases o características de la conversación). Por ejemplo, puede establecer etiquetas de categoría para ver qué porcentaje de llamadas corresponden a ventas adicionales o a cancelación de cuentas.

Proporcione a sus agentes acceso a los detalles de las conversaciones de interacciones anteriores. Las transcripciones paso a paso proporcionan información como la opinión de los clientes, los problemas detectados y las interrupciones.

Transcribe Medical

Transcriba con precisión el audio de un solo altavoz que se encuentra comúnmente en los casos de uso de dictados médicos. Más información

Transcriba con precisión el audio conversacional de varios altavoces compuesto por médicos o pacientes por igual. Más información

Transcriba voz a texto en una amplia gama de especialidades médicas. Más información

Transcriba archivos de audio médicos grabados a escala con alta simultaneidad. Más información

Aumente la precisión de la transcripción mediante el uso de vocabulario personalizado para terminología que podría estar fuera del léxico. Más información

Separe la voz de los distintos altavoces dentro de cualquier audio monocanal. Más información