Tatoeba

Wikipedia, Entziklopedia askea
Tatoeba.org
URL helbidea http://tatoeba.org/eus
Komertziala?Ez
Webgune mota Auzolanean eraikitako esaldi osoen hiztegi modukoa
Erabiltzailea erregistratzeaHautazkoa
Jabea Trang Ho, Allan Simon
EgileaTrang Ho, Allan Simon
Argitalpen data2006
EgoeraOnline

Tatoeba.org auzolanean sorturiko doaneko datubase erraldoia da. Milaka esaldiekin datu base handi bat egitea da helburua, hizkuntza ikasleei laguntzeko xedearekin. Webgunearen izena japonieratik hartuta dago,"tatoeba" (例えば tatoeba), eta horren itzulpena "adibidez"-edo izan liteke.

Hiztegiek hitzen ordainak ematen badituzte, Tatoeba proiektuak esaldien ordainak emateko sortu zen, esaldi osoen itzulpenak. Esaldiak, jakina, modu askotan itzul daitezke eta Tatoeba proiektuaren asmoa itzulpen posible horien bilduma handia egitea da. Bestalde, emandako itzulpen batzuk desegokiak izan daitezke. Proiektuak aukera ematen die erabiltzaileei elkarri iradokizunak eta iruzkinak egiteko, guztien artean bilduma ahalik eta handien eta ahalik eta fidagarrien lortzeko helburuarekin beti ere.

Proiektuaren asmoa[aldatu | aldatu iturburu kodea]

Egileen asmoa hizkuntzen arteko itzulpenen bilduma handi bat egitea zen eta horretarako erabiltzaileei aukera osoa ematea izan zen proposamean. Erabiltzaileak izango dira esaldien eta itzulpenen jabeak baina Tatoeba proiektuan parte hartuz gero, esaldi guztiak Creative Commons Aitortu lizentziarekin partekatzeko prest agertu beharko.

Edukiak[aldatu | aldatu iturburu kodea]

Datu basea pixkanaka-pixkanaka handitzen ari da. Gero eta hizkuntza gehiago erabiltzen dira itzulpenetan eta esaldien kopurua handituz doa. 3.300.000 esaldi baino gehiago zegoen 2014ko abuztuan[1]eta ia 140.000 audio[1]. Euskara lehen 60 hizkuntzen artean[1] ibili da urtetan.

Tatoeba proiektuan corpus handiei leku egin nahiko liekete. Horrela gertatu da, esate baterako Tanaka corpusarekin. Hyogo Unibertsitateko Yasuhito Tanaka irakaslearen gidaritzapean 150.000 bat esaldi duen corpusa, (ingelesa > - < japoniera), kopiatu zen Tatoeba proiektura.

Historia[aldatu | aldatu iturburu kodea]

Tatoeba Trang Ho izeneko emakume batek sortu zuen 2006. urtean. Hasieran ostatze zerbitzua Sourceforgeren baitan egon zen eta proiektuaren hasierako izena "multilangdict" izan zen.[2] Gero Allan Simon bilakatu zen, 2009. urtean, Trang Ho-rekin batera proiektuko sustatzaile nagusi. [3] Tatoeba azken urteotan Frantzian du ostatu, eta ostatze zerbitzua The Free Software Foundation Frantziakoak eskaintzen dio.[4] 2014. urtean, abuztuan, proiektuak 8 administratzaile edo kudeatzaile nagusi zeuzkan, [5] eta ia hiru milioi esaldi guztira[6].

Interfazea[aldatu | aldatu iturburu kodea]

Pantaila-argazki hau egin zenean euskara 28. postuan zegoen.

Interfazea hainbat hizkuntzatan topa daiteke, horien artean euskara[7]. Erabiltzaileak, izenik eman gabe ere, erregistrorik gabe nahi izanez gero, hitz baten bilaketa egin dezakete. Goiko kutxatilatxoan hitz bat idatzi eta Tatoeba proiektuak hitz horrekin dauzkan esaldiak erakutsiko ditu, eta esaldi horien beste zenbait hizkuntzetako itzulpenak.

Esaldi batzuek etiketak dauzkate. Etiketak eta audioak bilatu daitezke Tatoebako datu-basean. Sistema pentsatuta dago sorburu eta helburu hizkuntzak hautatzeko eta, nahi izanez gero, bilaketa egiterakoa hizkuntza bat hautatu beharrean "hizkuntza guztiak" hauta daiteke.

Izena emanda, erregistroa egin eta gero erabiltzaileak esaldiak, zerrendak, etiketak, iruzkinak, itzulpenak... gehi ditzake Tatoeba.org datu-basera. Asmoa, argi dago, ahalik eta datu baserik handien eta zehatzen lortzea da. Horretarako erabiltzaileei kalitatezko lana eskatzen zaie. Esaldi osoak, ondo dakien hizkuntza batean besterik ez kargatzeko.[8]

Erabiltzaile guztiek beraiek kargaturiko esaldiak aldatzeko eta ezabatzeko aukera dute. Beste erabiltzaileen esaldiak aldatzeko aukera zuzenik ez dago baina iruzkinak utz daitezke, iradokizun edo iruzkinekin; esaldiaren jabeari aldaketaren bat eska dakioke.

Datubasearen estruktura[aldatu | aldatu iturburu kodea]

Diagrama honen bidez erakutsi nahi da esaldiak edozein norabidetan itzul daitezkeela Tatoeba proiektuan.

Tatoeba proiektuaren oinarrizko datuen estruktura nodo segidak eta esteka segidak dira. Esaldi oro nodo bat da; esteka bakoitzak zubia egiten du esanahi berbera duten beste hizkuntzetako bi esaldietara.[9]

Lizentzia[aldatu | aldatu iturburu kodea]

Tatoeba datubase osoa Creative Commons Aitortu 2.0 lizentziapean argitaratu da.

Jasotako diru-laguntzak[aldatu | aldatu iturburu kodea]

Tatoebak diru-laguntzak jaso ditu, esate baterako Mozilla Drumbeat taldearengandik 2010ko abenduan.[10][11]


Offline edizioa[aldatu | aldatu iturburu kodea]

Tatoeba proiektuko zenbait esaldi hautatu ––83,932 esaldi hain zuzen ere Esperanto hizkuntzan–– eta bere ordainak hainbat hizkuntzatan – agertu ziren Esperanto Elektronike DVDaren hirugarren edizioan ("Electronic Esperanto"). DVDaren 6.000 kopia argitaratu zituen E@I horrek 2011eko uztailean.

Erreferentziak[aldatu | aldatu iturburu kodea]

Kanpoko estekak[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]