Nyomtatás
2017. október 17., kedd 10:05

DeepL Translator – áttörés a gépi fordításban?

Értékelés:
(3 szavazat)

neural machine translation deepl

2017. augusztus végén DeepL Translator néven újabb online fordító indult útjára, amely az előzetes várakozások szerint idővel akár legfőbb versenytársát, a Google Fordítót is legyőzheti. Merésznek tűnhet a kijelentés, hiszen a keresőóriás fordítószolgáltatása jelenleg több mint 100 nyelven érhető el, ezzel szemben az újonnan piacra lépő DeepL Translator jelenleg mindössze 7 nyelven fordít (angol, német, francia, spanyol, olasz, holland és lengyel), összesen 42 kombinációban. Folyamatban van ugyan a mandarin, japán és orosz nyelvek fejlesztése is, a nyelvek száma tekintetében viszont még így sem veheti fel a versenyt a már piacon lévő online fordítókkal.

A DeepL Translator szolgáltatásról egyelőre meglepően keveset lehet tudni; a közzétett sajtóanyagok szolgálhatnak valamelyest bővebb információval. Ezekből kiderül, hogy egy vakteszt során a fordítóeszköz magasan a versenytársak fölött teljesített. A teszt abból állt, hogy 100 különböző mondatot adtak fordításra a Google Translate, a Microsoft Translator, a Facebook és a DeepL Translator programoknak, majd angolról németre, franciára és spanyolra, illetve ugyanerről a három nyelvről angolra kellett átültetni a forrásszöveget. Ezután profi szakfordítókat kértek meg, hogy értékeljék az elkészült fordításokat. (A fordítók nem tudták, hogy melyik fordítást melyik program készítette.) A végeredmény alapján a trónkövetelő leiskolázta a mezőnyt: a második legjobban teljesítő Google Fordítóval szemben háromszor annyi szakfordító választotta a DeepL Translator által készített célnyelvi verziót. Az eredményre bizonyára sokan felkapják a fejüket, hiszen a köztudatban egyelőre még a Google Fordító él mint a leghatékonyabb gépi fordító szolgáltatás. De mit is tud pontosan a DeepL és kik állnak mögötte?

A DeepL Translator egy német vállalat, a DeepL legújabb fejlesztése, amely kifejezetten mesterséges intelligencián alapuló termékekre specializálódott. Ha elsőre ez nem mondana túl sokat, korábbi nevük talán ismerősen csenghet, a cég ugyanis 2017-ig Linguee néven működött. A Linguee.com a vállalat népszerű webalapú szótár- és fordítószolgáltatása, amely a DeepL Translator fejlesztésében is kiemelt szerepet játszott. Lássuk, hogyan.

A DeepL Translator az ún. mesterséges neurális hálózatok technológiáján alapul. A fogalom talán már nem ismeretlen, hiszen közel három éve tartja lázban a mesterséges intelligenciával foglalkozókat, erőteljes paradigmaváltást hozva el a gépi fordítás területén is, ahol neurális gépi fordítás (neural machine translation, NMT) néven alkalmazzák. A nagy vetélytárs, a Google 2016 őszén kezdte alkalmazni az új technológiát a Google Translate által készített fordításokban, bizonyos nyelvpárokban, a Microsoft pedig szintén ezt az újítást használja szöveg- és beszédalapú fordítórendszereiben, többek között a Skype Translator alkalmazásban is. A neurális hálózatok technológia lényegében egy mesterségesen létrehozott neurális hálót takar, amely az emberi agyban található neuronok működését imitálja. Ez a mesterséges neurális háló ugyanúgy képes a különböző tanulási folyamatokra (ún. deep learning), akárcsak az emberi agy.

Gereon Frahling, a DeepL vállalat alapítója és ügyvezető igazgatója – aki egyébként maga is a Google-nél kezdte a pályafutását – nem kevesebbet állít, mint hogy a neurális háló felépítésében történt jelentős fejlesztéseknek köszönhetően, valamint a neuronok és a közöttük lévő összeköttetések átrendezésével az általuk megalkotott program minden eddiginél természetesebb és érthetőbb fordításokat képes készíteni. A fejlesztők megközelítése szerint ugyanis a neurális háló teljesítménye nagyban függ attól, hogy a tanulási folyamat során milyen anyag áll a gép rendelkezésére. A DeepL esetében a helyzeti előny éppen a forrásanyag minőségében rejlik, és itt jön ismét a képbe a Linguee.

A Linguee szerverei kétnyelvű formában tárolják a kizárólag humán fordítók által lefordított szövegeket. A korpusz alapját főként európai uniós illetve különféle szabadalmi dokumentumok képezik, a tárolt szövegek száma jelenleg egymilliárd felett van, és mivel webalapú, folyamatosan bővül. A Linguee keresőmotorjai minőség szerint válogatják le a talált kétnyelvű szövegeket, az online felület pedig lehetőséget ad arra is, hogy a felhasználók visszajelzéseket küldjenek be, még tovább javítva ezzel a fordítások minőségét. Ez a humán fordítók által lefordított kétnyelvű szövegekből álló hatalmas korpusz képezi a DeepL Translator tanulási anyagának alapját. Helyzeti előnye tehát abban rejlik, hogy a neurális háló ezeket a fordításokat vizsgálja és találja meg bennük a mintákat egy-egy szöveg lefordításához.

Érdekesség, hogy a DeepL a világ 23. legnagyobb szuperszámítógépén fut, amelyet Izlandon építettek meg. A helyszínválasztás oka, hogy a szigetország megújuló energiaforrásainak köszönhetően jóval költséghatékonyabb módon képesek elérni ugyanazt az eredményt: az eszköz jelenleg egymillió szót képes lefordítani, kevesebb mint 1 másodperc alatt.

A Le Monde francia napilap tesztelte is az újonnan megjelent online fordítót: angolról franciára fordíttattak a programmal különböző műfajú és típusú szövegeket: Emily Dickinson To Make a Prairie c. versét, a PlayStation 4 útmutatójának rövid részletét, egy régészeti témájú újságcikket, egy miniszteri beszéd néhány mondatát, és egy sportösszefoglalót. A kapott eredményeket a Google, Bing, Yandex és Baidu teljesítményével hasonlították össze. Az újságcikk és a miniszteri beszéd fordításában egyértelműen a DeepL teljesített a legjobban, a műszaki szöveggel mind az öt program viszonylag könnyen megbirkózott, a versfordítás mindegyik programnak feladta a leckét, de nem született egyértelmű győztes, az archeológiai témájú cikk fordításában pedig lényegében az összes versenyző elvérzett. Összefoglalásként a cikk szerzői azt állapították meg, hogy még mindig meglehetősen könnyű átverni a gépi fordítót, illetve a gép „ridegsége” még akkor is kiérződik a szövegből, ha nagyjából helyesen lett lefordítva. Tagadhatatlan azonban, hogy a fejlődés még így is látványos, már ami a különböző eszközök teljesítményét és a fordítás minőségét illeti.

 

Forrás:

deepl.com

Le Monde

 

Hasznos lehet még:

A gépi fordítás korlátai

A Google Translate – előnyök és hátrányok

Megjelent: 11393 alkalommal Utoljára frissítve: 2018. október 03., szerda 12:29

Legfrissebb a szerzőtől:

Oldalainkon sütiket használunk.