Kiel Esperanto aldoniĝis en Google Translate

Publikigita Majo 15, 2012 de Marek Blahuš

(tiu ĉi artikolo de Marek Blahuš unue aperis en revuo Esperanto, aprilo 2012, n-ro 1257 (4), p. 78)

Ekde la 22-a de februaro 2012 Esperanto ĉeestas inter la lingvoj subtenataj de Google Translate, la plej konata maŝintraduka programo, senpage uzebla per la interreta adreso http://translate.google.com. La aldono de Esperanto kiel 64-a lingvo surprizis la esperantistojn kaj kaŭzis ondon de entuziasmo, sed ankaŭ kritikon de la kvalito de la produktataj tradukaĵoj. Tamen regas konsento pri tio, ke la paŝo de Google estas grava reklamo por Esperanto kiel vivanta lingvo. Revuo Esperanto akiris ekskluzivajn informojn pri la fono de tiu decido.

Ĉe maŝintradukado necesas distingi inter du bazaj aliroj al la problemo: Regulbazita, kiu uzas vortarojn kaj gramatikajn regulojn verkitajn de lingvistoj, kaj statistika, kiu uzas algoritmojn verkitajn de programistoj per kiuj la maŝino aŭtomate lernas el granda kvanto de dulingvaj tekstoj jam antaŭe tradukitaj de homo. La Google-Tradukilo apartenas al la dua kategorio. Tial ĝi ofte eraras pri la akuzativo aŭ ne rekonas iun kunmetaĵon, sed pro la sama kialo ĝi scias foje surprizi per eleganta esprimo aŭ konas vorton kiu ne aperas en multaj vortaroj. Per tiu aliro la programisto ankaŭ povas prilabori iun lingvon eĉ sen devi kompreni ĝin, kaj anstataŭ okupiĝi pri unu konkreta lingvoparo li povas koncentriĝi je plibonigo de la tradukalgoritmo kiel tuto. La tekstoj per kiuj Google trejnas sian tradukilon venas ĉefe el libroj (Google mem ciferecigis multajn), de organizoj kiel UN, kaj el retpaĝoj.

Multaj esperantistoj scivolas pri la eksterordinara favoro de Google, kiu jam en 2007 en reklama video konsilis al la uzantoj de sia retpoŝta servo Gmail profiti la tempon ŝparitan de ĝia spam-filtrilo por fari ĝuindajn aferojn kiel ekzemple lerni Esperanton (la videon ĉe http://www.gmail.com/fightspam spektis 1,5 milionoj da homoj), kaj kiu en 2009 omaĝis la 150-an jubileon de Zamenhof per portempa ŝanĝo de sia emblemo kaj igis 2 milionojn da homoj serĉi informojn pri li kaj Esperanto en Vikipedio. Pro tio revuo Esperanto sin turnis rekte al Google, kiu afable donis respondojn al la demandoj de la esperantistoj.

Thorsten Brants, profesia sciencisto laboranta por Google, informis ke neniu el la inĝenieroj rekte envolvitaj en la aldonado de Esperanto mem parolas la lingvon, kaj klarigis ke fakte estas sufiĉe kutime ke la teamo okupiĝas pri lingvo kiun neniu el ĝiaj membroj denaske scipovas. Kelkajn el la 64 subtenataj lingvoj eĉ ne parolas iu ajn el la tuta dungitaro de Google. Tio tamen ne estas la kazo de Esperanto: “Ekzistas eta Esperanto-komunumo ĉe Google kiu helpis pritaksi la kvaliton de la sistemo, kaj Franz Och, kiu gvidas la projekton Google Translate, lernis iom da Esperanto kiel infano,” malkaŝis Brants. “Pasintjare ni trovis tradukistojn kiuj tradukis al Esperanto niajn testajn datumojn, kaj je nia granda surprizo ni konstatis, ke kvalito de la Esperanto-sistemo estis komparebla kun lingvoj por kiuj ni havas multe pli da datumoj, kaj ke ĝi estis multe pli bona ol ĉe ĉiuj lingvoj por kiuj ni havas same malmultan datumkvanton – sen ke ni iel ajn speciale klopodis tion. Tial, post iom da poluro kaj plia testado, ni decidis ke venis la tempo por lanĉi ĝin.”

Kiel Brants konfirmis, kvankam la programo scias traduki ekz. inter Esperanto kaj la ĉina, nuntempe ĉiuj tradukoj al kaj el Esperanto okazas pere de la angla kiel interlingvo. Ĝuste por ĝi Google kutime disponas plej multajn jam pretajn tradukaĵojn, kaj ne ekzistas plano aldoni aliajn rektajn parojn por Esperanto. Li tamen invitis la esperantistojn kontribui al plibonigo de la tradukilo korektante la tradukojn (per musklako sur erara vorto) kaj taksante ilin “helpema”, “nehelpema” aŭ “ofenda” (per la eta kontrolmarko sube dekstre en la rezultokampo). Eblas ankaŭ uzi la programon Google Translator Toolkit por redakti kaj alŝuti tradukaĵojn. La faritaj ŝanĝoj ne definitiviĝos tuj, sed ebligos al la tradukilo pliboniĝi en la estonto.

P.S. Post la apero de tiu ĉi artikolo en revuo Esperanto, en aprilo 2012, ni ricevis sciigon de Peter Rybín, slovaka tradukisto kaj esperantisto, kiu informis ke la firmao SDL (evoluiganto de la tradukprogramo Trados) antaŭ kelkaj monatoj dungis lin por traduki kelkajn mallongajn tekstojn el la angla lingvo en Esperanton. La laboro estis mendita de Google, evidente rilate al la testado de Google Translate, kiun en la intervjuo menciis Thorsten Brants.

Sugesto: Google Translate ne estas perfekta, sed ĝia forta flanko estas la ligiteco al aliaj servoj de Google: Voĉon de angle parolata video en YouTube nun eblas aŭtomate rekonigi kaj la subtekstojn tradukigi en Esperanton. Provu spekti la paroladon de Steve Jobs en Standford ĉe http://tinyurl.com/jobscc (klaku la ruĝan butonon “CC” sub la video, elektu “Traduki priskribojn BETA” kaj en la falmenuo Esperanton).

Share on FacebookShare on VKShare on Google+Tweet about this on TwitterShare on RedditShare on LinkedInEmail this to someone

2 Komentoj por “Kiel Esperanto aldoniĝis en Google Translate”

  1. Mélanie Maradan skribis:

    Via parentaza klarigo “firmao SDL (evoluiganto de la tradukprogramo Trados)” ne estas tute prave. Tiu tradukprogramo estis ĉefe evoluigita fare de Trados GmbH, kiu estis germana firmao, kaj tiam nomiĝis “Trados”. En 2005 la brita firmao SDL aĉetis tiun germana firmaon, kune kun la pria tradukprogramo. Do laŭ mia kompreno la brita firmao SDL tute ne evoluigis la programon (nur ekde 2005 grandskale vendas sed modere pluevoluigas ĝin sub la nomo “SDL Trados” aŭ “SDL Trados Studio”).

  2. blahma skribis:

    Dankon pro via reago kaj la precizigo, Mélanie. Prave mi do skribis “evoluiganto” kaj ne “evoluiginto” aŭ eĉ “kreinto” (ja antaŭ skribi mi rapide kontrolis en Vikipedio kaj tie ja legis ke la programo estis aĉetita). Ŝajnas al mi kvazaŭ vi malkontentas pri tio ke SDL ne plu multe zorgas pri Trados kaj nur “grandskale vendas” ĝin – pri tio mi tamen bedaŭrinde ne povas helpi. Por la artikolo gravas la rakonto de Peter Rybín, kiu informis nin ke SDL kontaktis lin ĝuste ĉar li estas uzanto de Trados kaj pro tio li estas konata al la firmao, inkluzive de sia retpaĝaro, kie li sian scipovon de Esperanto indikas.