مسار الترجمة
يفصل النظام الخلفي بين الإدخال، والترجمة، والتحقق، وإعادة البناء بحيث يحتفظ كل تنسيق ملف ببنيته بينما يركز محرك الترجمة على المعنى والمصطلحات والاتساق.
يتم التحقق من الملفات المرفوعة وتحليلها وتحويلها إلى وحدات قابلة للترجمة قبل بدء استدعاءات النماذج.
- يتم رفض أنواع الملفات غير المدعومة من خلال التحقق من نوع الملف وMIME قبل دخولها إلى الطابور.
- يتم استخراج المستندات إلى عقد نصية، أوراق، شرائح، مقاطع، أو JSON منظم حسب التنسيق.
- يتم تعيين مصطلحات القاموس والكلمات المستثناة إلى معرفات آمنة لضمان بقاء أسماء العلامات التجارية والعناصر النائبة والعبارات المحمية دون تغيير أثناء الترجمة.
يقوم النظام بتوجيه المحتوى المُعد عبر نماذج لغوية وخدمات ترجمة سحابية مختارة باستخدام مطالبات تعتمد على السياق.
- يدعم النظام خدمات OpenAI وClaude وGemini وGrok وMistral وGoogle Cloud وAWS للترجمة.
- يتم تقسيم المحتوى وفق حدود الرموز للنماذج مع الحفاظ على السياق المحيط عندما يسمح التنسيق بذلك.
- تقوم عمال Bull المدعومة بـ Redis بمعالجة مهام الترجمة بشكل غير متزامن حتى لا تعيق الملفات الكبيرة واجهة البرمجة.
بعد الترجمة، يتم التحقق من المخرجات مقابل البنية المتوقعة وتصحيحها إذا كانت غير مكتملة أو غير صحيحة.
- يتم تتبع التقدم عبر مراحل المعالجة المسبقة والترجمة والمعالجة اللاحقة.
- يمكن أن تؤدي أخطاء JSON أو XML أو بنية المستند إلى تشغيل منطق الإصلاح وإعادة المحاولة.
- يسجل سجل الترجمة الحالة وعدد الكلمات وحجم الملف والنموذج المستخدم ونسبة المعالجة.
يتم إعادة إدراج الترجمات التي تم التحقق منها في بنية المستند الأصلية وتخزينها وإتاحتها فقط من خلال مسارات مصرح بها.
- يتم استعادة المصطلحات المحمية وتعيينات القاموس قبل إنهاء الملف المترجم.
- يتم إعادة بناء المستندات المترجمة إلى تنسيقها النهائي وتحميلها إلى تخزين S3 الآمن.
- تضمن عمليات التحقق من الوصول وملكية المستخدم وسياق المؤسسة أن تكون النتائج متاحة للحساب الصحيح فقط.