2017. december 29., péntek

MI AZ A KOLLOKÁCIÓ, ÉS HOGYAN FORDÍTSA A GÉP ANGOLRA, HOGY "BAKOT LŐ"

QUBIT
Szerző: KÁLMÁN LÁSZLÓ
2017.12.29.



Kedves olvasóink, emlékeztek még a teknőcös-entrópiás példákra? (Mellékesen megjegyzem: tessék nyugodtan teknősbékának hívni, legalább a 14. század óta bevett szó ez, és ha valaki szerint mégis „helytelen”, annak üzenem, hogy a bazsarózsa sem rózsa, meg a tubarózsa sem, de még a pünkösdirózsa sem. Ott egye meg a fene, aki ezek helyett a latin nevüket használja, csak kötelezővé ne tegyék.) Sokakban felvetődött, még levelet is kaptam róla, hogy mi a gyakorlati jelentősége ennek a módszernek, hogy nem lehetne-e valami ütős példával bemutatni a használatát. Ezért most mutatok egy érdekes használati területet, a nyelvtechnológiából, az úgynevezett kollokációk azonosítását. 

Hogy mi is az a kollokáció, az elég vitatott kérdés. Vannak, akik minden olyan többszavas kifejezést így hívnak, ami nagyon gyakori, szokványos, például azt is, hogy dolgozni megy, meg azt is, hogy bakot lő, meg azt is, hogy romokban hever. Pedig az első egyszerűen csak gyakori, de semmi szokatlan nincs benne, teljesen transzparens a jelentése, vagyis világos, hogy hogyan jön ki a jelentése a részeiből, míg a második kettő nem ilyen. A bakot lő pont az ellenkezője, hiszen amikor ezt tesszük, annak általában se a bakhoz, se a lövéshez semmi köze. Az ilyen kifejezéseket a nyelvészek idiómának nevezik. Végül a romokban hever kifejezést talán megérti az is, aki sosem hallotta (a bakot lő-ről ezt nem lehet elmondani), de magától nem jutna eszébe, hogy ezt így kell kifejezni. Ezért ezt szakszerűen produkciós idiómának nevezik, de van olyan is, aki csak ezt az alesetet nevezi kollokációnak.


Shooting bucks, avagy baklövészet

A nyelvtechnológiában nyilván fontos a kollokációkat azonosítani, legalábbis a kevésbé transzparens fajtái nyilván fontosak, például a számítógépes, automatikus megértés szempontjából, mert ezek azok, amiket nem lehet „szó szerint” megérteni. Az más kérdés, hogy például a gépi fordítást sokszor megértés nélkül próbálják megoldani, pusztán statisztikai alapon. Például a bakot lőkifejezésnek egy jó nagy korpuszban számtalan angol megfelelője lehet, de gyakorlatilag egyikben sincs szó `bakról' (buck) meg `lövésről' (shoot) – leggyakrabban olyasmit találunk, mint make a mistake. (És legyünk optimisták: ha a szövegkörnyezetből kiderül, hogy mondjuk vadászatról van szó, akkor még az is lehet, hogy a fordító abban a környezetben valószínűbbnek fogja találni a shoot a buck fordítást.) De még a statisztikai alapú értelmezést is segítheti, ha megtaláljuk a kollokációkat, és ezt pont olyan eszközökkel szokták végezni, mint amiket a kiagyalt teknősbékás példán bemutattam...

Nincsenek megjegyzések:

Megjegyzés küldése