Tatoeba

Wikipedia, Entziklopedia askea
Osoitz (eztabaida | ekarpenak)(r)en berrikusketa, ordua: 00:08, 31 abuztua 2016
Tatoeba.org
URL helbidea http://tatoeba.org/eus
Komertziala?Ez
Webgune mota Auzolanean eraikitako esaldi osoen hiztegi modukoa
Erabiltzailea erregistratzeaHautazkoa
Jabea Trang Ho, Allan Simon
EgileaTrang Ho, Allan Simon
Argitalpen data2006
EgoeraOnline; beta

Tatoeba.org auzolanean sorturiko doaneko datubase erraldoia da. Milaka esaldiekin datubase handi bat egitea da helburua, hizkuntza ikasleei laguntzeko xedearekin. Webguenearen izena japonieratik hartuta dago,"tatoeba" (例えば tatoeba), eta horren itzulpena "adibidez"-edo izan liteke.

Hiztegiek hitzen ordainak ematen badituzte, Tatoeba proiektuak esaldien ordainak emateko sortu zen, esaldi osoen itzulpenak. Esaldiak, jakina, modu askotan itzul daitezke eta Tatoeba proiektuaren asmoa itzulpen posible horien bilduma handia egitea da. Bestalde, emandako itzulpen batzuk desegokiak izan daitezke. Proiektuak aukera ematen die erabiltzaileei elkarri iradokizunak eta iruzkinak egiteko, guztien artean bilduma ahalik eta handien eta ahalik eta fidagarrien lortzeko helburuarekin beti ere.

Proiektuaren asmoa

Egileen asmoa hizkuntzen arteko itzulpenen bilduma handi bat egitea zen eta horretarako erabiltzaileei aukera osoa ematea izan zen proposamean. Erabiltzaileak izango dira esaldien eta itzulpenen jabeak baina Tatoeba proiektuan parte hartuz gero, esaldi guztiak Creative Commons Aitortu lizentziarekin partekatzeko prest agertu beharko.

Edukiak

Datu basea pixkanaka-pixkanaka handitzen ari da. Gero eta hizkuntza gehiago erabiltzen dira itzulpenetan eta esaldien kopurua handituz doa. 3.300.000 esaldi baino gehiago zegoen 2014ko abuztuan[1]eta ia 140.000 audio[2]. Euskara lehen 60 hizkuntzen artean[3] ibili da urtetan.

Tatoeba proiektuan corpus handiei leku egin nahiko liekete. Horrela gertatu da, esate baterako Tanaka corpusarekin. Hyogo Unibertsitateko Yasuhito Tanaka irakaslearen gidaritzapean 150.000 bat hitz duen corpusa, (ingelesa > - < japoniera), kopiatu zen Tatoeba proiektura.

Historia

Tatoeba Trang Ho izeneko emakume batek sortu zuen 2006. urtean. Hasieran ostatze zerbitzua Sourceforgeren baitan egon zen eta proiektuaren hasierako izena "multilangdict" izan zen.[4] Gero Allan Simon bilakatu zen, 2009. urtean, Trang Ho-rekin batera proiektuko sustatzaile nagusi. [5] Tatoeba azken urteotan Frantzian du ostatu, eta ostatze zerbitzua The Free Software Foundation Frantziakoak eskaintzen dio.[6] 2014. urtean, abuztuan, proiektuak 8 administradore edo kudeatzaile nagusi zeuzkan. [7]

Interfazea

Interfazea hainbat hizkuntzatan topa daiteke, horien artean euskara[8]. Erabiltzaileak, izenik eman gabe ere, erregistrorik gabe nahi izanez gero, hitz baten bilaketa egin dezakete. Goiko kutxatilatxoan hitz bat idatzi eta Tatoeba proiektuak hitz horrekin dauzkan esaldiak erakutsiko ditu, eta esaldi horien beste zenbait hizkuntzetako itzulpenak.

Esaldi batzuek etiketak dauzkate. Etiketak eta audioak bilatu daitezke Tatoebako datu-basean. Sistema pentsatuta dago sorburu eta helburu hizkuntzak hautatzeko eta, nahi izanez gero, bilaketa egiterakoa hizkuntza bat hautatu beharrean "hizkuntza guztiak" hauta daiteke.

Izena emanda, erregistroa egin eta gero erabiltzaileak esaldiak, zerrendak, etiketak, iruzkinak, itzulpenak... gehi ditzake Tatoeba.org datu-basera. Asmoa, argi dago, ahalik eta datubaserik handien eta zehatzen lortzea da. Horretarako erabiltzaileei kalitatezko lana eskatzen zaie. Esaldi osoak, ondo dakien hizkuntza batean besterik ez kargatzeko.[9]

Erabiltzaile guztiek beraiek kargaturiko esaldiak aldatzeko eta ezabatzeko aukera dute. Beste erabiltzaileen esaldiak aldatzeko aukera zuzenik ez dago baina iruzkinak utz daitezke, iradokizun edo iruzkinekin; esaldiaren jabeari aldaketaren bat eska dakioke.

Datubasearen estruktura

Diagrama honen bidez erakutsi nahi da esaldiak edozein norabidetan itzul daitezkeela Tatoeba projektuan.

Tatoeba proiektuaren oinarrizko datuen estruktura nodo segidak eta esteka segidak dira. Esaldi oro nodo bat da; esteka bakoitzak zubia egiten du esanahi berbera duten beste hizkuntzetako bi esaldietara.[10]

Lizentzia

Tatoeba datubase osoa Creative Commons Aitortu 2.0 lizentziapean argitaratu da.

Jasotako diru-laguntzak

Tatoebak diru-laguntzak jaso ditu, esate baterako Mozilla Drumbeat taldearengandik 2010ko abenduan.[11][12]


Offline edizioa

Tatoeba proiektuko zenbait esaldi hautatu ––83,932 esaldi hain zuzen ere Esperanto hizkuntzan–– eta bere ordainak hainbat hizkuntzatan – agertu ziren Esperanto Elektronike DVDaren hirugarren edizioan ("Electronic Esperanto"). DVDaren 6.000 kopia argitaratu zituen E@I horrek 2011eko uztailean.

Erreferentziak

Kanpoko estekak