Vigoko Unibertsitateko Corpus Linguistikoa

Vigoko Unibertsitateko Corpus Linguistikoa
Jatorria
Ezaugarriak
Ekoizpena
Garatzailea	Vigoko Informatikako Hizkuntzalaritza Mintegia
	sli.uvigo.es…

Vigoko Unibertsitateko Corpus Linguistikoa (CLUVI, Corpus Lingüístico da Universidade de Vigo) hainbat testu-itzulpen bildu duen corpus linguistiko paraleloa da. Vigoko Unibertsitateko Hizkuntzalaritza Informatikoaren Mintegiak sortu zuen.^[1]

Ezaugarriak[aldatu | aldatu iturburu kodea]

CLUVI corpusa testu-bilduma irekia da, Vigoko Unibertsitateko SLI taldeak egina. 2018an 49 milioi hitz zituen, horietatik galizierazko testuak ia 12 milioi hitz ziren eta LEGA Corpusa 6 milioi hitz inguru.

CLUVIko baliabideak Galizierazko Hizkuntza-Baliabide Integratuak errepositorioan integratuta daude (RILG, Recursos Integrados da Lingua Galega).

Itzulpen motak[aldatu | aldatu iturburu kodea]

Bibliaren itzulpena, itzulpen juridikoa, testu informatiboen itzulpena, literatur itzulpena, azpitituluen itzulpena, softwarearen lokalizazioa, itzulpen sozioekonomikoa, itzulpen turistikoa.

Hizkuntza-konbinazioak[aldatu | aldatu iturburu kodea]

Galiziera - Eleanitza, Ingelesa - Galiziera, Frantsesa - Galiziera, Galiziera - Gaztelania, Galiziera - Galiziera, Portugesa - Galiziera, Portugesa - Ingelesa - Gaztelania, Portugesa - Gaztelania, Euskara - Gaztelania.

Itzulpen-hizkuntzak[aldatu | aldatu iturburu kodea]

Galiziera, Gaztelania, Ingelesa, Portugesa, Euskara, Katalana, Frantsesa, Bibliaren itzulpena The UNESCO Courier Literatur itzulpena: FR-GL, Txinera, Alemana, Latina, Italiera.

Corpus itzulpen-partaleloak[aldatu | aldatu iturburu kodea]

Corpus CLUVI (latin-galiziera-portugalesa-katalana-frantsesa-italiera-espainiera-txinera, Bibliako testuak)
Corpus CLUVI (galiziera-gaztelania, testu juridikoak)
Corpus CLUVI (ingeles-galiziera-frantses, Unescoren Posta-testuak)
Corpus CLUVI (ingeles-galiziera, programa informatikoak)
Corpus CLUVI (ingeles-galiziera, literatura-testuak)
Corpus CLUVI (frantses-galiziera, literatura-testuak)
Corpus CLUVI (galiziera, literatura-testuak)
Corpus CLUVI (galiziera-gaztelania, literatura-testuak)
Corpus CLUa (gaztelania-galiziera-euskara, Consumer aldizkariaren testuak)
Corpus CLUVI (espainiera-galiziera, turismoko testuak)
Corpus CLUVI (galiziera-txinera, filmen azpitituluak)
Corpus CLUVI (ingelesa-galiziera, filmes azpitituluak)
Multimedia CLUVI corpusa (ingelesa-galiziera, filmes azpitituluak)

Hiztegiak[aldatu | aldatu iturburu kodea]

Ingelesa-galiziera
Frantsesa-Galiziera
Espainiera-galiziera

Hasiera[aldatu | aldatu iturburu kodea]

CLUVI, 2006ko urrian, 22 milioi hitz ingurukoa zen. Honela dago osatuta CLUVI corpusa:

Galiziera-gaztelania LEGA corpus juridikoa (5 877 769 hitz)
Corpus UNESCO ingeles-galiziera-frantses zientzia-dibulgazioko espanierra (3 724 620 hitz)
Ingeles-galiziera softwarea aurkitzeko CORPUS LOGALIZA (1 701 834 hitz)
galizierazko TECTRA literatura-corpusa (1 476 020 hitz)
Corpus literario FEGA frantses galiziera (1 267 119 hitz)
Gaztelania-galiziera-euskara kontsumo-informazioa (5 586 431 hitz)
Corpus juridikoa LEGEA-EUSKARAZKO BI (2 384 053 hitz)

CLUVIren beste atal batzuk, arren, hauek direnak:

Galiziera-gaztelania ekonomiako EGAL corpusa (718.642 hitz)
Ingelesezko TECTRA corpus literarioa (735.529 hitz)
Literatura-corpusa TECTRA ing-gaztelania (122.251 hitz)
Corpus literarioa DEGA–galiziera (76.364 hitz)
Ingelesezko filmen azpitituluen VEIGA corpusa (78.032 hitz)
Portugalgo eta gaztelaniako literatura postkolonialeko PALOP corpusa (566.590 hitz)