Canalización de traducción
El backend separa la ingesta, traducción, validación y reconstrucción para que cada formato de archivo mantenga su estructura mientras el motor de traducción se enfoca en el significado, la terminología y la consistencia.
Los archivos subidos se validan, analizan y convierten en unidades estructuradas traducibles antes de iniciar las llamadas a los modelos.
- Las comprobaciones de tipo de archivo y MIME rechazan cargas no compatibles antes de entrar en la cola.
- Los documentos se extraen en nodos de texto, hojas, diapositivas, segmentos o JSON estructurado según el formato.
- Los términos del glosario y las palabras ignoradas se asignan a identificadores seguros para que nombres de marca, marcadores de posición y frases protegidas se mantengan durante la traducción.
El sistema enruta el contenido preparado a través de LLMs seleccionados y servicios de traducción en la nube con prompts sensibles al contexto.
- Se admiten servicios de traducción de OpenAI, Claude, Gemini, Grok, Mistral, Google Cloud y AWS en el backend.
- El contenido se divide según los límites de tokens de los modelos, preservando el contexto cuando el formato lo permite.
- Workers de Bull respaldados por Redis procesan las traducciones de forma asíncrona para que los archivos grandes no bloqueen la API.
Después de la traducción, la salida se verifica contra la estructura esperada y se corrige si es incompleta o inválida.
- El progreso se rastrea a través de preprocesamiento, traducción y posprocesamiento.
- JSON, XML o estructuras de documento inválidas pueden activar lógica de reparación y reintentos.
- El historial de traducción registra estado, conteo de palabras, tamaño del archivo, modelo utilizado y porcentaje de procesamiento.
Las traducciones validadas se reintegran en la estructura original del documento, se almacenan y se exponen solo mediante flujos autorizados.
- Los términos protegidos y mapeos del glosario se restauran antes de finalizar el archivo.
- Los documentos traducidos se reconstruyen en su formato final y se cargan en almacenamiento seguro S3.
- Las verificaciones de acceso, propiedad del usuario y contexto organizacional aseguran que los resultados estén limitados a la cuenta correcta.