Sistem mimarisi

GPT Translator karmaşık dosyaları nasıl güvenilir çok dilli belgelere dönüştürür

Çeviri sistemimiz aşamalı bir pipeline olarak tasarlanmıştır: belgeler ayrıştırılır, korumalı terimler eşlenir, içerik akıllı model yönlendirme ile çevrilir, çıktı doğrulanır ve nihai dosya yetkili erişim için güvenli şekilde yeniden oluşturulur.

Redis

Kuyruk motoru

10 iş

Worker eşzamanlılığı

Canlı

İlerleme güncellemeleri

Depolama katmanı

GPT Translator belge çeviri mimarisi diyagramı

Çeviri pipeline’ı

Kalite, ölçeklenebilirlik ve kontrol için dört aşamalı mimari

Backend, alım, çeviri, doğrulama ve yeniden yapılandırmayı ayırır; böylece her dosya formatı yapısını korurken çeviri motoru anlam, terminoloji ve tutarlılığa odaklanır.

Ön işleme

Yüklenen dosyalar, model çağrıları başlamadan önce doğrulanır, ayrıştırılır ve yapılandırılmış çevirilebilir birimlere dönüştürülür.

Dosya türü ve MIME kontrolleri, desteklenmeyen yüklemeleri kuyruğa girmeden reddeder.
Belgeler, formata bağlı olarak metin düğümlerine, sayfalara, slaytlara, segmentlere veya yapılandırılmış JSON’a dönüştürülür.
Sözlük terimleri ve yok sayılan kelimeler güvenli tanımlayıcılara eşlenir; böylece marka adları, yer tutucular ve korumalı ifadeler çeviri sırasında korunur.

Akıllı çeviri motoru

Sistem, hazırlanmış içeriği bağlama duyarlı istemlerle seçilmiş LLM’ler ve bulut çeviri hizmetleri üzerinden yönlendirir.

Backend’de OpenAI, Claude, Gemini, Grok, Mistral, Google Cloud ve AWS çeviri hizmetleri desteklenir.
İçerik, model token limitlerine göre bölünür ve mümkün olduğunda bağlam korunur.
Redis destekli Bull worker’lar çeviri işlerini asenkron işler; böylece büyük dosyalar API’yi engellemez.

Kalite güvencesi

Çeviri sonrası çıktı, beklenen yapı ile karşılaştırılır ve eksik veya hatalıysa düzeltilir.

İlerleme, ön işleme, çeviri ve son işleme aşamalarında takip edilir.
Geçersiz JSON, XML veya belge yapısı, onarım ve yeniden deneme mantığını tetikleyebilir.
Çeviri geçmişi; durum, kelime sayısı, dosya boyutu, kullanılan model ve işlem yüzdesini kaydeder.

Güvenlik ve yeniden yapılandırma

Doğrulanmış çeviriler, orijinal belge yapısına geri yerleştirilir, saklanır ve yalnızca yetkili akışlar üzerinden erişilebilir.

Korumalı terimler ve sözlük eşlemeleri, dosya tamamlanmadan önce geri yüklenir.
Çevrilen belgeler hedef formata dönüştürülür ve güvenli S3 depolamaya yüklenir.
Erişim kontrolleri, kullanıcı sahipliği ve organizasyon bağlamı, sonuçların doğru hesapla sınırlı olmasını sağlar.

Operasyonel güvenilirlik

Gerçek çeviri iş yükleri için tasarlandı

Kuyruk worker’ı birden fazla işi paralel işler ve uzun süreçleri istek yaşam döngüsünün dışında tutar.

Socket tabanlı ilerleme olayları, frontend’i her aşamada güncel tutar.

Cron izleme, başarısız ve devam eden çevirileri takip ederek sorunların hızlıca tespit edilmesini sağlar.

Token tahmini ve kullanım güncellemeleri, plan limitlerini korumak ve hata durumunda tahmin sağlamak için çeviri öncesi ve sonrası yapılır.