Rosetta proiektua

Wikipedia, Entziklopedia askea

Rosetta Proiektua hizkuntzalari aditu eta jatorrizko hiztunen arteko mundu mailako elkarlana da Rosetta harriaren bertsio garaikidea garatzeko. AEBetako Long Now Fundazioak gidatzen du. Bere helburua ikerketa esanguratsuak egitea eta 1.500 bat hizkuntza hautatuen fitxategien kopiak egitea da. Hizkuntza horietako batzuetan mila hiztun baino gutxiago daude munduan. Munduko hizkuntza batzuk hiltzen ari direla aurreikusten da[1][2], kanpoko gobernuen zentralizazioagatik eta globalizazio prozesuengatik, ingelesa eta beste hizkuntza handiek hiztunen artean nagusitzen ari direlako. Asmoa euskarri erabilgarriak sortzea da, hizkuntzalaritza konparatua, ikerketa eta irakaskuntza egiteko. Hizkuntza-lanabes erabilgarriak sortu nahi dira dauden hizkuntzak konparatzeko eta ikertzeko eta agian, etorkizunean, galdutako hizkuntzak berreraikitzeko edo berreskuratzeko.

Proiektua mundu mailako hizkuntza fitxategi erraldoia sortzea da, erabat irekia egiten dizkioten ekarpen guztiei. Jatorrizko Oxford Hiztegi ingelesa sortzeko erabili zen antzeko estrategiaz baliatu nahi dira berrikusketei irekiak egon ahal izateko. Ondorioz, artxibategia beti egongo da jendaurrean ikusgai, sekreturik gabe, eta horretarako hiru euskarri erabiliko dira: interneteko artxibategi erraldoi bat, etengabe artxibo berriak eta berrikusketak onartuz; mikro-grabaketa bat nikel aleaziozko diskoa edo Monelezko diskoa hiru hazbetekoa hau da (7.62 cmkoa) eta 2.000 urteko bizi-itxaropena duena, eta azkenik, erreferentzia liburu monumental bakar bat, euskarri digitalekin-eta.

Azalpena[aldatu | aldatu iturburu kodea]

Munduko populazioaren % 95ek egiten dituzten hizkuntzak (irudian gorriz) mende honetan desagertzeko arrisku handian.

Aurreikusten da katalogatu diren[3] munduko hizkuntzen artean gehienak desagertuko direla mende honetan[4][5][6][1][2]. Aurreikuspen ezkorrenek munduko hizkuntzen ehuneko laurogeita hamar galtzeko arriskuan daudela diote. Desagertuko diren hainbat hizkuntza ez dute dokumentazio handirik utziko. Hizkuntza horien gainean egindako ikerketa asko, batez ere hizkuntza oso gutxituei buruzkoak, nahiko oharkabean egon dira. Egindako ikerketa horiek askotan norbanakoen esku besterik ez daude, luze irauteko aukera gutxirekin eta finantziazio eskaseko artxibo edo biltegietan.

Munduko hizkuntza dibertsitatea, kultura ondare baliotsu hori, nolabait gordetzeko AEBetako Long Now Foundazioa artxibategi ireki zabal bat sortzen ari da online, ikertzaileei begira, eta asmoa da oso iraunkorra izango den euskarri fisikoa duen fitxategia ekoiztea, non munduko gutxi-gorabeherako 7.000 hizkuntzetatik[7][8][9][10][11][12][13] hautaturiko 1.500 hizkuntzen berri emango da.

Proiektuaren helburu nagusia:

  • Sortzea orain arte inoiz sortu den munduko hizkuntzen corpusik handiena, hizkuntzen konparazioa egin ahal izateko eta beste hainbat ikerketetarako. Irakaskuntzarako ere erabilgarri izan liteke corpus hori.
  • Garatzea hizkuntzak berreskuratzeko eta berreraikitzeko erabilgarri izango den lanabesa.
  • Eskaintzea estetikoki oso erakargarri izango den objektua, objektu horrek munduko giza hizkuntzen dibertsitatearen ikur berria izango litzateke, mantendu nahi den dibertsitatearen ikurra.

Artxibatu nahiko lirateke 1.500 hizkuntzetatik hainbat testu paralelo hautatuko lirateke, testuen erkaketak errazteko, Rosetta Harri hura gogoan.

Proiektua software librearekin garatu nahi da.

Proiektuaren atzetik AEBetako hainbat unibertsitate, fundazio eta liburutegi publiko: Stanford, Yale, Berkeley, AEBetako Kongresuko Liburutegia, eta the American Summer Institute of Linguistics.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. a b (Ingelesez) One of the World's 7,000 Languages Dies Every Three Months. 2018-11-05 (Noiz kontsultatua: 2022-01-28).
  2. a b (Ingelesez) «Rare and Dying Languages of the World» www.farandwide.com (Noiz kontsultatua: 2022-01-28).
  3. (Ingelesez) «Language Names» Ethnologue (Noiz kontsultatua: 2022-01-28).
  4. (Ingelesez) Admin, Nova. (2021-09-21). «Extinction of indigenous languages leads to loss of exclusive knowledge about medicinal plants» Nova Languages (Noiz kontsultatua: 2022-01-28).
  5. (Ingelesez) «Of the world’s 7000 languages, fully half may disappear within our lifetimes. At risk is a vast archive of knowledge and expertise, a catalog of the imagination that is the human legacy.» The Global Catholic Climate Movement 2017-10-17 (Noiz kontsultatua: 2022-01-28).
  6. (Ingelesez) Aulakh, Raveena. (2013-04-15). «Dying languages: scientists fret as one disappears every 14 days» The Toronto Star ISSN 0319-0781. (Noiz kontsultatua: 2022-01-28).
  7. (Ingelesez) https://plus.google.com/+UNESCO. (2021-04-06). «The languages in cyberspace» UNESCO (Noiz kontsultatua: 2022-01-28).
  8. (Ingelesez) «Browse by Language Name» Ethnologue (Noiz kontsultatua: 2022-01-28).
  9. (Ingelesez) «Free Language Learning Software | 7000 Languages | United States» 7000 Languages (Noiz kontsultatua: 2022-01-28).
  10. (Ingelesez) «Languages of the World - Nations Online Project» www.nationsonline.org (Noiz kontsultatua: 2022-01-28).
  11. (Ingelesez) «There are 7,000 languages in use around the world - this is why they matter» World Economic Forum (Noiz kontsultatua: 2022-01-28).
  12. (Ingelesez) «How many languages are there in the world? | Linguistic Society of America» www.linguisticsociety.org (Noiz kontsultatua: 2022-01-28).
  13. (Ingelesez) Joshi, Pratik; Santy, Sebastin; Budhiraja, Amar; Bali, Kalika; Choudhury, Monojit. (2020-07). «The State and Fate of Linguistic Diversity and Inclusion in the NLP World» Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (Association for Computational Linguistics): 6282–6293.  doi:10.18653/v1/2020.acl-main.560. (Noiz kontsultatua: 2022-01-28).

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]