Çeviri pipeline’ı
Backend, alım, çeviri, doğrulama ve yeniden yapılandırmayı ayırır; böylece her dosya formatı yapısını korurken çeviri motoru anlam, terminoloji ve tutarlılığa odaklanır.
Yüklenen dosyalar, model çağrıları başlamadan önce doğrulanır, ayrıştırılır ve yapılandırılmış çevirilebilir birimlere dönüştürülür.
- Dosya türü ve MIME kontrolleri, desteklenmeyen yüklemeleri kuyruğa girmeden reddeder.
- Belgeler, formata bağlı olarak metin düğümlerine, sayfalara, slaytlara, segmentlere veya yapılandırılmış JSON’a dönüştürülür.
- Sözlük terimleri ve yok sayılan kelimeler güvenli tanımlayıcılara eşlenir; böylece marka adları, yer tutucular ve korumalı ifadeler çeviri sırasında korunur.
Sistem, hazırlanmış içeriği bağlama duyarlı istemlerle seçilmiş LLM’ler ve bulut çeviri hizmetleri üzerinden yönlendirir.
- Backend’de OpenAI, Claude, Gemini, Grok, Mistral, Google Cloud ve AWS çeviri hizmetleri desteklenir.
- İçerik, model token limitlerine göre bölünür ve mümkün olduğunda bağlam korunur.
- Redis destekli Bull worker’lar çeviri işlerini asenkron işler; böylece büyük dosyalar API’yi engellemez.
Çeviri sonrası çıktı, beklenen yapı ile karşılaştırılır ve eksik veya hatalıysa düzeltilir.
- İlerleme, ön işleme, çeviri ve son işleme aşamalarında takip edilir.
- Geçersiz JSON, XML veya belge yapısı, onarım ve yeniden deneme mantığını tetikleyebilir.
- Çeviri geçmişi; durum, kelime sayısı, dosya boyutu, kullanılan model ve işlem yüzdesini kaydeder.
Doğrulanmış çeviriler, orijinal belge yapısına geri yerleştirilir, saklanır ve yalnızca yetkili akışlar üzerinden erişilebilir.
- Korumalı terimler ve sözlük eşlemeleri, dosya tamamlanmadan önce geri yüklenir.
- Çevrilen belgeler hedef formata dönüştürülür ve güvenli S3 depolamaya yüklenir.
- Erişim kontrolleri, kullanıcı sahipliği ve organizasyon bağlamı, sonuçların doğru hesapla sınırlı olmasını sağlar.