Käännösputki
Taustajärjestelmä erottaa sisäänoton, käännöksen, validoinnin ja uudelleenrakennuksen, jotta jokainen tiedostomuoto säilyttää rakenteensa samalla kun käännösmoottori keskittyy merkitykseen, terminologiaan ja johdonmukaisuuteen.
Ladatut tiedostot validoidaan, jäsennetään ja muunnetaan rakenteellisiksi käännettäviksi yksiköiksi ennen mallikutsuja.
- Tiedostotyyppi- ja MIME-tarkistukset hylkäävät ei-tuetut lataukset ennen jonoon pääsyä.
- Dokumentit puretaan tekstisolmuihin, taulukoihin, dioihin, segmentteihin tai rakenteiseen JSON-muotoon tiedostotyypin mukaan.
- Sanastotermit ja ohitetut sanat kartoitetaan turvallisiin tunnisteisiin, jotta brändinimet, paikkamerkit ja suojatut ilmaukset säilyvät käännöksessä.
Järjestelmä ohjaa valmistellun sisällön valittujen LLM-mallien ja pilvipohjaisten käännöspalveluiden kautta kontekstin huomioivilla kehotteilla.
- Taustajärjestelmä tukee OpenAI-, Claude-, Gemini-, Grok-, Mistral-, Google Cloud- ja AWS-käännöspalveluja.
- Sisältö pilkotaan mallien token-rajojen mukaan säilyttäen konteksti mahdollisuuksien mukaan.
- Redis-pohjaiset Bull-työntekijät käsittelevät käännöstehtävät asynkronisesti, jotta suuret tiedostot eivät estä APIa.
Käännöksen jälkeen tulos tarkistetaan odotettua rakennetta vasten ja korjataan, jos se on puutteellinen tai virheellinen.
- Edistymistä seurataan esikäsittelyn, käännöksen ja jälkikäsittelyn aikana.
- Virheellinen JSON, XML tai dokumenttirakenne voi käynnistää korjaus- ja uudelleenyrityslogiikan.
- Käännöshistoria tallentaa tilan, sanamäärän, tiedostokoon, käytetyn mallin ja käsittelyn edistymisen.
Varmennetut käännökset palautetaan alkuperäiseen dokumenttirakenteeseen, tallennetaan ja ovat saatavilla vain valtuutettujen prosessien kautta.
- Suojatut termit ja sanastokartoitukset palautetaan ennen tiedoston viimeistelyä.
- Käännetyt dokumentit rakennetaan kohdemuotoon ja tallennetaan turvalliseen S3-tallennukseen.
- Käyttöoikeustarkistukset, käyttäjän omistajuus ja organisaatiokonteksti varmistavat, että tulokset ovat oikean tilin käytettävissä.