Kaixo!
Gaur aurkeztu da jada iazko Humanitate Digitalen bekan egindako lana eta, horietako bat, Larramendiren Hiztegi Hirukoitza digitalizatu eta Wikitekara ekartzea izan da. Azken hilabetean lan nahiko egin dut ikertu dutenekin eta Wikitekan duzue, txukun txukun, igota: https://eu.wikisource.org/wiki/Hiztegi_Hirukoitza.
BAINA: digitalizazioa OCR bidez egin da eta akatsak daude, letra batzuk ez dituelako ondo ulertu sistemak. Horregatik, eskuz egin behar da konprobazioa. Hemen (https://eu.wikisource.org/wiki/Aurkibide:Larramendi_1745_dictionary_body.pdf), orrialde bakoitza ikusi eta balidatzen joan beharko ginateke. Eta guztiok egiten badugu, ba azkarrago egingo dugu lan hori eta lagunduko diegu ikerlariei.
Egin beharrekoa sinplea da: orrialde bat hartu, begiratu ea testuak dakarrena eta jatorrizkoa bat datozen eta, ez badatoz bat, aldatu. Ondoren, behean, balidazioa aldatu testuari (gorriz daude orain, horira pasa behar ditu lehen irakurleak). Horiz dauden orriak jada orraztu ditu norbaitek eta, bigarren orrazketa bat ematen zaienean berdera pasa eta balidatu gisa agertuko lirateke. Honela, orrialde bakoitzak bi balidazio behar ditu definitiboki argitaratuta egoteko.
Lan handia da, baina bakoitzak tarte txikietan egin dezakeen zerbait bada ere. Animatuko al gara?