Vigoko Unibertsitateko Corpus Linguistikoa

Wikipedia, Entziklopedia askea
Vigoko Unibertsitateko Corpus Linguistikoa
Jatorria
Ezaugarriak
Ekoizpena
GaratzaileaVigoko Informatikako Hizkuntzalaritza Mintegia
sli.uvigo.es…

Vigoko Unibertsitateko Corpus Linguistikoa (CLUVI, Corpus Lingüístico da Universidade de Vigo) hainbat testu-itzulpen bildu duen corpus linguistiko paraleloa da. Vigoko Unibertsitateko Hizkuntzalaritza Informatikoaren Mintegiak sortu zuen.[1]

Ezaugarriak[aldatu | aldatu iturburu kodea]

CLUVI corpusa testu-bilduma irekia da, Vigoko Unibertsitateko SLI taldeak egina. 2018an 49 milioi hitz zituen, horietatik galizierazko testuak ia 12 milioi hitz ziren eta LEGA Corpusa 6 milioi hitz inguru.

CLUVIko baliabideak Galizierazko Hizkuntza-Baliabide Integratuak errepositorioan integratuta daude (RILG, Recursos Integrados da Lingua Galega).

Itzulpen motak[aldatu | aldatu iturburu kodea]

Bibliaren itzulpena, itzulpen juridikoa, testu informatiboen itzulpena, literatur itzulpena, azpitituluen itzulpena, softwarearen lokalizazioa, itzulpen sozioekonomikoa, itzulpen turistikoa.

Hizkuntza-konbinazioak[aldatu | aldatu iturburu kodea]

Galiziera - Eleanitza, Ingelesa - Galiziera, Frantsesa - Galiziera, Galiziera - Gaztelania, Galiziera - Galiziera, Portugesa - Galiziera, Portugesa - Ingelesa - Gaztelania, Portugesa - Gaztelania, Euskara - Gaztelania.

Itzulpen-hizkuntzak[aldatu | aldatu iturburu kodea]

Galiziera, Gaztelania, Ingelesa, Portugesa, Euskara, Katalana, Frantsesa, Bibliaren itzulpena The UNESCO Courier Literatur itzulpena: FR-GL, Txinera, Alemana, Latina, Italiera.

Corpus itzulpen-partaleloak[aldatu | aldatu iturburu kodea]

  • Corpus CLUVI (latin-galiziera-portugalesa-katalana-frantsesa-italiera-espainiera-txinera, Bibliako testuak)
  • Corpus CLUVI (galiziera-gaztelania, testu juridikoak)
  • Corpus CLUVI (ingeles-galiziera-frantses, Unescoren Posta-testuak)
  • Corpus CLUVI (ingeles-galiziera, programa informatikoak)
  • Corpus CLUVI (ingeles-galiziera, literatura-testuak)
  • Corpus CLUVI (frantses-galiziera, literatura-testuak)
  • Corpus CLUVI (galiziera, literatura-testuak)
  • Corpus CLUVI (galiziera-gaztelania, literatura-testuak)
  • Corpus CLUa (gaztelania-galiziera-euskara, Consumer aldizkariaren testuak)
  • Corpus CLUVI (espainiera-galiziera, turismoko testuak)
  • Corpus CLUVI (galiziera-txinera, filmen azpitituluak)
  • Corpus CLUVI (ingelesa-galiziera, filmes azpitituluak)
  • Multimedia CLUVI corpusa (ingelesa-galiziera, filmes azpitituluak)

Hiztegiak[aldatu | aldatu iturburu kodea]

  • Ingelesa-galiziera
  • Frantsesa-Galiziera
  • Espainiera-galiziera

Hasiera[aldatu | aldatu iturburu kodea]

CLUVI, 2006ko urrian, 22 milioi hitz ingurukoa zen. Honela dago osatuta CLUVI corpusa:

  • Galiziera-gaztelania LEGA corpus juridikoa (5 877 769 hitz)
  • Corpus UNESCO ingeles-galiziera-frantses zientzia-dibulgazioko espanierra (3 724 620 hitz)
  • Ingeles-galiziera softwarea aurkitzeko CORPUS LOGALIZA (1 701 834 hitz)
  • galizierazko TECTRA literatura-corpusa (1 476 020 hitz)
  • Corpus literario FEGA frantses galiziera (1 267 119 hitz)
  • Gaztelania-galiziera-euskara kontsumo-informazioa (5 586 431 hitz)
  • Corpus juridikoa LEGEA-EUSKARAZKO BI (2 384 053 hitz)

CLUVIren beste atal batzuk, arren, hauek direnak:

  • Galiziera-gaztelania ekonomiako EGAL corpusa (718.642 hitz)
  • Ingelesezko TECTRA corpus literarioa (735.529 hitz)
  • Literatura-corpusa TECTRA ing-gaztelania (122.251 hitz)
  • Corpus literarioa DEGA–galiziera (76.364 hitz)
  • Ingelesezko filmen azpitituluen VEIGA corpusa (78.032 hitz)
  • Portugalgo eta gaztelaniako literatura postkolonialeko PALOP corpusa (566.590 hitz)

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. «Corpus CLUVI» ilg.usc.gal (Noiz kontsultatua: 2023-10-18).

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]