ReconVox es nuestro motor de reconocimiento del habla continua. Obtenga la transcripción en una conversación telefónica o analice las respuestas en IVRs modernos basados en preguntas abiertas y lenguaje natural.
También puede trabajar en modo Word-Spotting para encontrar nombres, marcas o frases clave definidas sobre la marcha.
Para obtener la transcripción de conversaciones en lenguaje natural.
Modo Word-Spotting
Para encontrar palabras o frases clave en grabaciones de voz.
Vocabularios personalizados
El diccionario y el modelo de lenguaje pueden definirse a medida desde cero.
Dos estilos de modelos de lenguaje
De propósito general para obtener la transcripción o basados en reglas específicas definidas por el usuario.
AutoLearn
Adaptación automática a pronunciaciones y acentos especiales o a entornos ruidosos.
API para soluciones en local
Eficiente incluso para sistemas empotrados.
Idiomas
Actualmente disponible en Español e Inglés. Más idiomas en preparación.
Independiente del locutor
No se necesita entrenamiento para cada locutor.
AutoLearn
Mejora de la precisión de manera rápida y continua en condiciones acústicas problemáticas.
Tecnología extremadamente flexible desarrollada íntegramente por DTec, puede ser utilizada tanto para mejorar la precisión de un locutor determinado como para adaptarse a regiones dialécticas problemáticas o a entornos acústicos ruidosos.
Algunas situaciones habituales:
Adaptar un idioma general a una variante local; por ejemplo, español castellano a un acento andaluz muy marcado.
Mejorar la robustez en canales de comunicación problemáticos; por ejemplo, transmisiones de radio o líneas telefónicas analógicas.
Mejorar la robustez en entornos acústicos ruidosos; por ejemplo, con ruido de fondo de motores.
Maximizar la precisión para locutores conocidos; por ejemplo, asistentes personales manejados por voz, domótica, control y desactivación de alarmas o IVRs de banca telefónica.
Se permiten dos modos de funcionamiento:
Automático
AutoLearn gestiona por sí mismo el proceso de aprendizaje; el administrador de la solución tan sólo lo activa cuando lo considera necesario y el usuario final sigue utilizando el sistema de la manera habitual.
Cuando se ha recopilado suficiente información de audio, AutoLearn entrena sobre la marcha un nuevo conjunto de modelos acústicos adaptados que son utilizados inmediatamente y un nuevo ciclo de aprendizaje comienza.
Supervisado
Si se desea optimizar y acelerar el proceso de aprendizaje, el administrador de la solución puede proporcionar un conjunto de grabaciones de voz especialmente seleccionadas junto con sus transcripciones exactas.
El administrador tiene control total acerca de la cantidad y el tipo de audio que se utilizará en cada iteración de aprendizaje.
Word-Spotting
Búsqueda de palabras clave definidas sobre la marcha.
Diseñado para buscar por contenido en grabaciones de voz o para monitorizar un flujo de audio en tiempo real y lanzar un alarma al detectar una palabra clave.
Este modo presenta varias ventajas respecto al reconocimiento del habla continua:
No es necesario definir por adelantado un vocabulario. Es posible buscar en directo palabras o frases clave definidas en el momento, como nuevas marcas comerciales, nombres propios o expresiones especiales. Simplemente teclee el nuevo concepto y lance la búsqueda.
Obtenga resultados significativos en conversaciones muy desestructuradas, en las que un modelo de lenguaje no puede representar adecuadamente la naturaleza del habla y por tanto la precisión de la transcripción es baja. En esas situaciones, en lugar de intentar obtener toda la transcripción es mejor optar por localizar expresiones clave mediante Word-Spotting.
Es posible combinar diferentes idiomas en una misma conversación, ya que este modo de reconocimiento ignora el audio que rodea las palabras clave de interés. Por ejemplo, usted puede buscar la palabra clave «Wiki-Leaks» pronunciada en inglés dentro de vídeos de YouTube hablados en inglés… ¡pero también en alemán o árabe!
Aplicaciones
Reconocimiento de voz con un enfoque eficiente y personalizable.