Pipeline de tradução
O backend separa ingestão, tradução, validação e reconstrução para que cada formato de arquivo mantenha sua estrutura, enquanto o mecanismo de tradução se concentra no significado, terminologia e consistência.
Os arquivos enviados são validados, analisados e convertidos em unidades estruturadas traduzíveis antes das chamadas aos modelos.
- Verificações de tipo de arquivo e MIME rejeitam uploads não suportados antes de entrarem na fila.
- Os documentos são extraídos em nós de texto, planilhas, slides, segmentos ou JSON estruturado, dependendo do formato.
- Termos do glossário e palavras ignoradas são mapeados para identificadores seguros para que nomes de marca, placeholders e frases protegidas sejam preservados durante a tradução.
O sistema encaminha o conteúdo preparado por meio de LLMs selecionados e serviços de tradução em nuvem com prompts sensíveis ao contexto.
- Serviços de tradução OpenAI, Claude, Gemini, Grok, Mistral, Google Cloud e AWS são suportados no backend.
- O conteúdo é dividido de acordo com os limites de tokens dos modelos, preservando o contexto sempre que possível.
- Workers Bull baseados em Redis processam tarefas de tradução de forma assíncrona para que arquivos grandes não bloqueiem a API.
Após a tradução, o resultado é verificado em relação à estrutura esperada e corrigido se estiver incompleto ou inválido.
- O progresso é acompanhado ao longo das fases de pré-processamento, tradução e pós-processamento.
- JSON, XML ou estruturas de documento inválidas podem acionar lógica de reparo e novas tentativas.
- O histórico de tradução registra status, contagem de palavras, tamanho do arquivo, modelo utilizado e porcentagem de processamento.
As traduções validadas são reinseridas na estrutura original do documento, armazenadas e disponibilizadas apenas por meio de fluxos autorizados.
- Termos protegidos e mapeamentos do glossário são restaurados antes da finalização do arquivo.
- Os documentos traduzidos são reconstruídos em seu formato de destino e enviados para armazenamento seguro S3.
- Verificações de acesso, propriedade do usuário e contexto organizacional garantem que os resultados estejam disponíveis apenas para a conta correta.