Reconocimiento del Habla | ReconVox

ReconVox es nuestro motor de reconocimiento del habla continua. No sólo es capaz de obtener la transcripción en una conversación telefónica, en sistemas IVR o en una emisión de radio o TV, si no que también puede trabajar en modo detección de palabras clave (Word-Spotting).

En este modo de funcionamiento es posible buscar dentro de una grabación (o bien detectar en tiempo real en un flujo de audio en directo) aquellas palabras o frases de interés definidas dinámicamente, descartando todo el contexto que las rodea, que puede estar en cualquier idioma.

ReconVox exporta sus funcionalidades a través de un potente API (Application Programming Interface), diseñado para ser integrado fácilmente en cualquier instalación local (on-premise). Próximamente disponible también como SaaS en la nube.

ReconVox es un desarrollo 100% de DTec y permite definir exactamente y a medida el vocabulario y modelo de lenguaje utilizados. Actualmente disponible en español e inglés, en preparación nuevos idiomas.

 

Descarga el PDF con la Hoja de Producto de ReconVox

 

 

AutoLearn es una tecnología desarrollada por DTec que permite a ReconVox aprender y mejorar su precisión a medida que va siendo utilizado. Soporta dos modos de funcionamiento:

  • Automático: AutoLearn gestiona todo el proceso de aprendizaje por sí solo, el usuario simplemente debe activarlo y seguir utilizando ReconVox de la manera habitual. Cuando hay suficiente información recopilada, AutoLearn genera unos modelos acústicos mejorados que son utilizados inmediatamente y un nuevo ciclo de aprendizaje comienza.

  • Supervisado: si se desea optimizar y acelerar el proceso de aprendizaje, es posible proporcionar grabaciones escogidas junto con sus transcripciones. El usuario tiene control total sobre la cantidad y tipo de audio que se va a utilizar durante el proceso de aprendizaje.

AutoLearn puede utilizarse para mejorar la precisión con un locutor determinado, pero también para adaptarse a regiones dialécticas problemáticas o entornos acústicos ruidosos.

Transcripción automática:

  • Conversaciones en call-centers con agentes.

  • Sistemas IVR de pregunta abierta.

  • Emisiones de radio y TV.

Speech Analytics por Word-Spotting:

  • Búsqueda de palabras clave en grabaciones.

  • Detección de palabras en flujos de audio monitorizados en directo.

  • Clipping de medios (marcas comerciales y personajes públicos).

Dispositivos electrónicos, domótica y videojuegos:

  • Control por voz de alarmas, domótica y sistemas electrónicos del vehículo.

  • Comunicación con compañeros controlados por la IA en videojuegos o con el ingeniero de pista en simuladores de conducción.

  • Manejo por voz de inventario, mapas, aviónica en simuladores de vuelo…

  • Respuestas de viva voz en juegos de concursos.

Aprendizaje de idiomas:

  • Análisis real de la pronunciación en plataformas de e-learning.

  • Respuestas de viva voz en ejercicios de conversación.