Vigoko Unibertsitateko Corpus Linguistikoa
Vigoko Unibertsitateko Corpus Linguistikoa | |
---|---|
Jatorria | |
Ezaugarriak | |
Ekoizpena | |
Garatzailea | Vigoko Informatikako Hizkuntzalaritza Mintegia |
sli.uvigo.es… |
Vigoko Unibertsitateko Corpus Linguistikoa (CLUVI, Corpus Lingüístico da Universidade de Vigo) hainbat testu-itzulpen bildu duen corpus linguistiko paraleloa da. Vigoko Unibertsitateko Hizkuntzalaritza Informatikoaren Mintegiak sortu zuen.[1]
Ezaugarriak[aldatu | aldatu iturburu kodea]
CLUVI corpusa testu-bilduma irekia da, Vigoko Unibertsitateko SLI taldeak egina. 2018an 49 milioi hitz zituen, horietatik galizierazko testuak ia 12 milioi hitz ziren eta LEGA Corpusa 6 milioi hitz inguru.
CLUVIko baliabideak Galizierazko Hizkuntza-Baliabide Integratuak errepositorioan integratuta daude (RILG, Recursos Integrados da Lingua Galega).
Itzulpen motak[aldatu | aldatu iturburu kodea]
Bibliaren itzulpena, itzulpen juridikoa, testu informatiboen itzulpena, literatur itzulpena, azpitituluen itzulpena, softwarearen lokalizazioa, itzulpen sozioekonomikoa, itzulpen turistikoa.
Hizkuntza-konbinazioak[aldatu | aldatu iturburu kodea]
Galiziera - Eleanitza, Ingelesa - Galiziera, Frantsesa - Galiziera, Galiziera - Gaztelania, Galiziera - Galiziera, Portugesa - Galiziera, Portugesa - Ingelesa - Gaztelania, Portugesa - Gaztelania, Euskara - Gaztelania.
Itzulpen-hizkuntzak[aldatu | aldatu iturburu kodea]
Galiziera, Gaztelania, Ingelesa, Portugesa, Euskara, Katalana, Frantsesa, Bibliaren itzulpena The UNESCO Courier Literatur itzulpena: FR-GL, Txinera, Alemana, Latina, Italiera.
Corpus itzulpen-partaleloak[aldatu | aldatu iturburu kodea]
- Corpus CLUVI (latin-galiziera-portugalesa-katalana-frantsesa-italiera-espainiera-txinera, Bibliako testuak)
- Corpus CLUVI (galiziera-gaztelania, testu juridikoak)
- Corpus CLUVI (ingeles-galiziera-frantses, Unescoren Posta-testuak)
- Corpus CLUVI (ingeles-galiziera, programa informatikoak)
- Corpus CLUVI (ingeles-galiziera, literatura-testuak)
- Corpus CLUVI (frantses-galiziera, literatura-testuak)
- Corpus CLUVI (galiziera, literatura-testuak)
- Corpus CLUVI (galiziera-gaztelania, literatura-testuak)
- Corpus CLUa (gaztelania-galiziera-euskara, Consumer aldizkariaren testuak)
- Corpus CLUVI (espainiera-galiziera, turismoko testuak)
- Corpus CLUVI (galiziera-txinera, filmen azpitituluak)
- Corpus CLUVI (ingelesa-galiziera, filmes azpitituluak)
- Multimedia CLUVI corpusa (ingelesa-galiziera, filmes azpitituluak)
Hiztegiak[aldatu | aldatu iturburu kodea]
- Ingelesa-galiziera
- Frantsesa-Galiziera
- Espainiera-galiziera
Hasiera[aldatu | aldatu iturburu kodea]
CLUVI, 2006ko urrian, 22 milioi hitz ingurukoa zen. Honela dago osatuta CLUVI corpusa:
- Galiziera-gaztelania LEGA corpus juridikoa (5 877 769 hitz)
- Corpus UNESCO ingeles-galiziera-frantses zientzia-dibulgazioko espanierra (3 724 620 hitz)
- Ingeles-galiziera softwarea aurkitzeko CORPUS LOGALIZA (1 701 834 hitz)
- galizierazko TECTRA literatura-corpusa (1 476 020 hitz)
- Corpus literario FEGA frantses galiziera (1 267 119 hitz)
- Gaztelania-galiziera-euskara kontsumo-informazioa (5 586 431 hitz)
- Corpus juridikoa LEGEA-EUSKARAZKO BI (2 384 053 hitz)
CLUVIren beste atal batzuk, arren, hauek direnak:
- Galiziera-gaztelania ekonomiako EGAL corpusa (718.642 hitz)
- Ingelesezko TECTRA corpus literarioa (735.529 hitz)
- Literatura-corpusa TECTRA ing-gaztelania (122.251 hitz)
- Corpus literarioa DEGA–galiziera (76.364 hitz)
- Ingelesezko filmen azpitituluen VEIGA corpusa (78.032 hitz)
- Portugalgo eta gaztelaniako literatura postkolonialeko PALOP corpusa (566.590 hitz)
Erreferentziak[aldatu | aldatu iturburu kodea]
- ↑ «Corpus CLUVI» ilg.usc.gal (Noiz kontsultatua: 2023-10-18).
Ikus, gainera[aldatu | aldatu iturburu kodea]
- Galizieraren Corpus Teknikoa
- Vigoko Informatikako Hizkuntzalaritza Mintegia
- Linguamática
- Xavier Gómez Guinovart
- Hizkuntzalaritza konputazionala
- Sociedad Española para el Procesamiento del Lenguaje Natural
- Computational Linguistics