We hebben er lang op moeten wachten, maar eindelijk kunnen we teksten automatisch van de ene in de andere taal laten vertalen. Maar hoe effectief is machinevertaling eigenlijk? En aan welke criteria moet een brontekst voldoen om neurale machinevertaling te kunnen toepassen?
In deze post zetten we alle feiten over machinevertaling op een rij, zodat je goed kunt afwegen of deze vertaaltechnologie aan jouw wensen en eisen voldoet.
Wat is machinevertaling en hoe werkt het?
Laten we bij een aantal basistermen beginnen. Machinevertaling is het proces waarbij een computer tekst in de ene taal omzet in tekst in een andere taal. Daarbij wordt een van de onderstaande methoden (of een combinatie daarvan) gevolgd:
- Op regels gebaseerde machinevertaling (RBMT) – De vertalingen worden gegenereerd op basis van taal- en grammaticaregels in combinatie met specifieke woordenboeken.
- Statistische machinevertaling (SMT) – De vertalingen worden gegenereerd op basis van statistische modellen die zijn samengesteld door grote databases met meertalige content (tweetalige tekstcorpora) te analyseren.
- Neurale machinevertaling (NMT) – Bij NMT wordt gebruikgemaakt van deep learning op basis van kunstmatige neurale netwerken. Dit werkt niet alleen sneller, maar levert ook betere vertalingen op. Deze methode wordt tegenwoordig het meest gebruikt.
Hoe nauwkeurig is neurale machinevertaling?
De kwaliteit van machinevertalingen hangt van meerdere factoren af:
- de configuratie van de vertaalmachine;
- de kwaliteit van de brontekst;
- waar de brontekst over gaat;
- de talencombinatie;
- hoeveel reeds vertaalde teksten er beschikbaar zijn om de vertaalmachine te trainen.
Zelfs wanneer de bovenstaande factoren allemaal optimaal zijn, is dat geen garantie dat de geproduceerde machinevertaling vrij van fouten is of in ieder geval geen ernstige fouten bevat.
Machinevertaling an sich (meestal onbewerkte of pure MT genoemd) wordt dan ook alleen voor specifieke scenario's gebruikt. Het moet duidelijk zijn dat een bepaald tolerantieniveau voor mogelijke vertaal- en andere fouten onvermijdelijk is.
Wanneer dat acceptabel is, kan onbewerkte MT een grote uitkomst bieden bij uitdagingen zoals een beperkt vertaalbudget of grote hoeveelheden tekst die snel vertaald moeten worden.
Wanneer de kans op fouten in een machinevertaling onacceptabel is, behoort een geïntegreerd proces tot de opties, dat wil zeggen een combinatie van MT en een echte vertaler die de machinevertaling nakijkt (post-editing).
Hoe werkt het post-editen van neurale machinevertalingen?
Post-editing houdt in dat een tekst die door een vertaalmachine is geproduceerd, nog eens grondig wordt nagekeken. Voor zover beschikbaar worden daarbij ook woordenlijsten en vertaalgeheugens geraadpleegd. De post-editor ziet erop toe dat voor termen de goedgekeurde vertaling wordt gebruikt.
Post-editing is niet hetzelfde als reviseren. Een revisie is een tweede, louter kwalitatieve controle van een vertaling die al van hoge kwaliteit is en waarin alle specificaties en instructies al zijn meegenomen.
Post-editing daarentegen heeft meer weg van een eerste vertaling, behalve dat de post-editor al een machinevertaling als uitgangspunt heeft, wat de productiviteit verhoogt. Net als bij een gewone vertaling zorgen post-editors ervoor dat de gewenste toon, terminologie en andere taalkundige eisen worden aangehouden.
Het is belangrijk dat post-editors de juiste vaardigheden hebben om met machinevertalingen te werken. Onze post-editors krijgen een training en we volgen de ISO 18587:2017-norm voor post-editing.
Hoe werkt neurale machinevertaling in combinatie met CAT-tools?
Machinevertaling is in de vertaalworkflow van de CAT-tool (Computer Assisted Translation) geïntegreerd. Resultaten uit vertaalgeheugens (voor zover beschikbaar) hebben prioriteit en die krijgt de vertaler dan ook als eerste aangeboden. De vertaalmachine komt in actie zodra er in de vertaalgeheugens geen matches met soortgelijke tekst staan. Die nieuwe teksten worden automatisch voorvertaald.
Hieronder staat de algemene workflow van een project waarbij gebruik wordt gemaakt van neurale machinevertaling:
Waar wordt neurale machinevertaling voor gebruikt?
Wanneer we onze klanten een machinevertaling met post-editing voorstellen, leggen we meestal deze opties voor:
Onbewerkte neurale machinevertaling: de geproduceerde machinevertalingen worden als zodanig geleverd, zonder dat er nog een vertaler van vlees en bloed naar kijkt. We raden aan alleen voor deze optie te kiezen als je alleen ongeveer wilt weten waar een tekst over gaat. Dit is de minst dure optie, want het is sneller geregeld en er komen weinig mensen aan te pas.
Neurale machinevertaling met post-editing: deze optie is ideaal voor content die gepubliceerd of breed verspreid moet worden. De machinevertalingen worden van a tot z door een menselijke vertaler nagekeken en waar nodig gecorrigeerd. Zo weet je zeker dat het eindresultaat aansluit op de doelgroep, dat de toon en stijl naar wens zijn en dat de boodschap ook in de doeltekst overkomt.
Aan welke criteria moet een brontekst voldoen om neurale machinevertaling te kunnen toepassen?
Vertaalprocessen waarbij machinevertaling wordt toegepast, waren lange tijd alleen geschikt voor bepaalde typen teksten en voor een beperkt aantal talencombinaties. Dankzij technologische vernieuwingen zijn we echter inmiddels al zover dat machinevertalingen in meer talencombinaties en voor alle typen teksten van betere kwaliteit zijn. Door de brontekst te analyseren en de vertaalbehoeften te inventariseren, kunnen we goed inschatten op welk punt in de vertaalworkflow machinevertaling het meeste nut heeft.
Hoeveel geld kun je met neurale machinevertaling besparen?
Veel mensen denken dat machinevertaling helemaal niets kost. Dat is niet zo, tenzij je altijd voor de onbewerkte optie kiest. Dat neemt niet weg dat je met machinevertaling tot wel 50% op je vertaalkosten kunt besparen (afhankelijk van de specifieke situatie).
Klaar voor de volgende stap?
Als je denkt dat je vertaalprocessen geoptimaliseerd kunnen worden met een vorm van machinevertaling, neem dan contact met ons op voor een gratis adviesgesprek. Onze experts kunnen je vertellen of jouw content hiervoor geschikt is en een technologische oplossing voorstellen die het beste bij jouw vertaalworkflows past.
Unveiling the meaning of machine translation quality
Understand the different approaches to evaluate machine translation quality and what they mean for your translation and localization needs.