De meeste mensen hebben wel eens een vertaalmachine zoals Google Translate, DeepL of Reverso gebruikt om een stukje op een website of een tekst in een andere taal te vertalen. Dit soort vertalingen noemen we ook wel machinevertalingen of automatische vertalingen (Machine Translation – MT). Concreet betekent het dat een computer (vaak via een website) een tekst van 1 taal naar een andere taal omzet, zonder tussenkomst van een mens. Dat klikt veelbelovend, maar is het dat ook? Hoe werkt het en is een machinevertaling direct geschikt voor publicatie?
De kwaliteit van dit soort online machinevertalingen is soms wisselend en daarom hebben veel mensen er nog hun vraagtekens bij. Voldoet een vertaalmachine bijvoorbeeld wel aan mijn zakelijke behoefte? Worden mijn gegevens vertrouwelijk behandeld bij een machinevertaling? Wat is Neural Machine Translation precies en kan ik dat integreren in mijn eigen workflow?
In dit artikel geven we antwoord op veelgestelde vragen rond machinevertalingen.
De eerste machinevertalingen werden uitgevoerd in de jaren ’50 van de vorige eeuw. Sindsdien heeft de ontwikkeling ervan niet stilgestaan en kunnen we inmiddels drie verschillende vertaalsystemen onderscheiden:
Vertaalsystemen op basis van regels (jaren ’80)
Dit zijn systemen waar woordenboeken met veelvoorkomende woorden worden gecombineerd met linguïstische (taalkundige) en grammaticaregels. De vertaalmachine (ook wel engine genoemd) moet worden gevoed met woordenboeken van de gebruiker om de vertalingen te verbeteren. Daardoor zal het eindresultaat niet direct voldoen aan de verwachting van de eindgebruiker. Toch kunnen op regels gebaseerde vertaalsystemen doorgaans samenhangende en logische vertalingen produceren, zolang de juiste, gespecialiseerde woordenboeken worden gebruikt.
Vertaalsystemen op basis van statistieken (jaren ’80-’90)
Anders dan systemen op basis van regels, worden bij systemen op basis van statistiek geen linguïstische regels gebruikt om te vertalen. In plaats daarvan worden statistische modellen ingezet, die automatisch worden opgebouwd vanuit de alsmaar groeiende hoeveelheid teksten. De engine analyseert de belangrijkste databases voor elke taal. Dit heeft tot resultaat dat er redelijk vloeiende, maar niet altijd logische vertalingen tot stand komen.
Vertaalsystemen op basis van neurale algoritmen (2015)
In de recente geschiedenis kwam voor het eerst de mogelijkheid om woordvolgorde te voorspellen. Met deze methode “leren” vertaalmachines te vertalen aan de hand van neurale netwerken die worden gevormd door verbindingen. Deze koppelingen lijken op de verbindingen die we kennen van ons brein. Neurale machinevertalingen openen de deuren tot vertalingen van betere kwaliteit. Neural Machine Translation bevat gemiddeld 50% minder onjuistheden in de woordvolgorde, 17% minder woordenschatfouten en 19% minder grammaticafouten. Neurale netwerken hebben zelfs geleerd om in verschillende talen de juiste grammatica en woordgeslachten toe te passen, zonder dat iemand het ze heeft geleerd. Neem bijvoorbeeld onderstaande Engelse zin die is vertaald naar het Nederlands. De zin is zowel door een generieke MT-engine vertaald, die geen rekening houdt met de context, als door een NMT-engine die is getraind op dit domein.
Neural Machine Translation voor Dummies
Brontekst Engels
Trainers wore trainers and left on trains
Vertaling generieke MT-engine
Trainers droegen trainers en vertrokken op treinen
Vertaling aangepaste NMT-engine
Trainers droegen sneakers en vertrokken met de trein
Lees hier wat vertaalmachines gaan brengen in de toekomst.
Vertaalofferte nodig? Klik dan hier.