Weka

Wikipedia, Entziklopedia askea
Jump to navigation Jump to search
Weka (software) logo.png Weka
Weka-3.5.5.png
Jatorria
Azken bertsioa 3.8.3
Ezaugarriak
Euskarria Java Virtual Machine Itzuli
Programazio-lengoaia Java
Irakur dezake Microsoft Windows eta Plataforma-anitz
Lizentzia GPLv3
Ekoizpena
Garatzailea University of Waikato Itzuli
www.cs.waikato.ac.nz/~ml/weka/
Iturri-kodea https://svn.cms.waikato.ac.nz/svn/weka/

Weka (Waikato Environment for Knowledge Analysis, euskaraz Ezagutzaren Analisirako Waikato Ingurunea) ikasketa automatikoan eta datu-meatzaritzan erabiltzen den software-ingurune bat da. Waikato-ko unibertsitatean garatu zen, Java programazio-lengoaian inplementatuta dago eta GNU-GPL lizentziapean banatzen den software librea da.[1]

Historia[aldatu | aldatu iturburu kodea]

  • 1993. urtean, Zeelanda Berriko Waikatoko unibertsitateak Weka-ren lehen bertsioa garatzeari ekin zion (TCL/TK eta C programazio-lengoaiak erabiliz).
  • 1997. urtean, kode guztia Java-ra itzultzea eta modelatze-algoritmoen inplementazioa gehitzea erabaki zen.
  • 2005. urtean, Wekak SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) taldearen eskutik "Data Mining and Knowledge Discovery Service Award" (euskaraz "Datu Meatzaritza eta Ezagutzaren Aurkikuntza Zerbitzua" saria jaso zuen.
  • 2006. urtean, Pentanho Corporation-ek lizentzia berezi bat eskuratu zuen Weka paketea business intelligence edo enpresa-adimenean erabiltzeko.

Deskribapena[aldatu | aldatu iturburu kodea]

Weka paketeak hainbat bistaratze-tresna eta algoritmo eskaintzen ditu datuen analisia egiteko eta sailkapen-eredu iragarleak sortzeko. Bere interfaze grafikoari esker paketearen funtzioak erabiltzea erraza gertatzen da.

Wekaren hasierako bertsioa TCL/TK programazio-lengoaian garatua izan zen eta beste programazio-lengoaia batzuetan inplementatutako algoritmoen ereduak sortzeko diseinatua izan zen. Gainera, ikasketa-automatikoko esperimentuetan datuen aurreprozesaketa egin ahal izateko C programazio-lengoaian inplementatutako hainbat zerbitzu ere gehitu zitzaizkion. Hasierako bertsio hura nekazaritza-arloko datuak aztertzeko helburuarekin sortu zen. Gaur egungo bertsioa ordea, Weka 3, Java programazio-lengoaian oinarrituta dago. Haren garapena 1997. urtean hasi zen eta aplikazio-eremu ugaritan erabiltzen da, batez ere irakaskuntzan eta ikerkuntzan.

Weka-ren ezaugarriak[aldatu | aldatu iturburu kodea]

Weka-ren ezaugarri nagusiak honakoak dira:

  • GNU lizentzia publiko orokorraren bidez babestua dagoenez, software librea da.
  • Oso eramangarria da, Java-n inplementatuta dagoenez plataformarekiko independentea delako.
  • Datuen aurreprozesaketa egiteko eta ikasketa automatikorako eredu eta teknika sorta zabala eskaintzen du.
  • Erabilerraza da, duen interfaze grafikoari esker.

Wekaren bidez datu-meatzaritzan estandarrak diren ataza asko ebatzi daitezke: datuen aurreprozesamendua, multzokatzea (ingelesezko clustering), sailkapen-problemak, erregresioa, bistaratzea eta aldagaien aukeraketa, besteak beste. Wekarekin esperimentuak egiteko garaian, datuak fitxategi lauetan gordeta daudela suposatzen da. Datu-baseetan gordetako datuak SQL bidezko kontsultekin atzitzea ere posiblea da, paketeak duen JDBC (Java Database Connectivity) konexioari esker, eta aukera ematen du kontsultak bueltatutako datuak prozesatzeko. Datu-base erlazionalen gainean datu-meatzaritza egitea ez da posiblea, baina datu-base erlazionalak taula bakarreko datu-base bihurtzeko aplikazioak badira, eta horiekin Wekak egin dezake lan.

Erabiltzailearen interfaze grafikoa[aldatu | aldatu iturburu kodea]

2007. urtera arte Wekaren interfazearen argazkia

Weka exekutatzean, interfazea aukeratzeko lehioa zabaltzen da (Weka GUI Chooser). Lau interfaze desberdin erabil daitezke: Simple CLI, Explorer, Experimenter eta Knowledge Flow.

Simple CLI[aldatu | aldatu iturburu kodea]

Simple CLI (Simple Command-Line Interface) interfazea kontsola bat da. Komando-linea moduko interfaze sinple honen bidez Weka-ren tresna guztiak erabil daitezke.

Explorer[aldatu | aldatu iturburu kodea]

Explorer (euskaraz, esploratzaile) interfazeak hainbat panel ditu:

  • Preproccess panelak datuak inportatzeko hainbat aukera ematen ditu: datu-base batetik, CSV fitxategi batetik, etab. Datu horiek aurreprozesatzeko iragazketa-algoritmo desberdinak eskaintzen dira. Algoritmo horiek datuak eraldatzeko erabil daitezke (zenbakizko datuak datu-diskretu bihurtzeko, adibidez). Gainera, aldez aurretik finkatutako hainbat irizpideetan oinarrituz, datuen multzotik hainbat erregistro (datu) eta atributu (aldagai-iragarle) ezabatzeko ere erabil daitezke.
  • Classify panelak sailkapen-algoritmoak erabiltzeko eta erregresio-analisia egiteko aukera ematen du. Gainera, erabilitako sailkapen-algoritmoaren ebaluazioa egin daiteke, asmatze-tasak kalkulatuz, ROC-kurbak eginez, etab. Posiblea denean, eredua bera bistaratzeko tresnak ere eskaintzen ditu, hala nola, sailkatze-zuhaitza.
  • Associate panelaren bidez, datuen atributuen artean aurkitu diren erlazio garrantzitsuenak identifika daitezke.
  • Cluster panelaren bidez Clustering edo multzokatze-teknikak erabil daitezke, adibidez K-means algoritmoa.
  • Selected attributes panelak datu-multzo batean iragarpenerako egokien diren atributu edo aldagai-iragarleak identifikatzeko algoritmoak eskaintzen ditu.
  • Visualize panelean puntu desberdinetako matrize bat (scatterplot) bat aurketzen da. Bertan puntu bakoitza aukeratu daiteke hau handitzeko eta hobeto detaile gehiagorekin aztertzeko.

Experimenter[aldatu | aldatu iturburu kodea]

Experimenter (euskaraz, esperimentatzaile) interfazearen bidez, hainbat datu-multzoren gainean Wekaren algoritmo iragarleak exekutatu eta lortutako emaitzen konparaketa sistematikoa egin daiteke.

Knowledge Flow[aldatu | aldatu iturburu kodea]

Knowledge Flow (euskaraz, ezagutzaren fluxu) interfazeak funtsean Explorer interfazearen funtzio berberak eskaintzen ditu. Gainera,ikasketa inkrementala egiteko aukera ere eskaini dezake.

Erlazionatutako Aplikazioak[aldatu | aldatu iturburu kodea]

  • KNIME, datu-meatzaritzarako plataforma bat da, Java programazio-lengoaian inplementatuta dagoena.
  • Neural Designer, analisi iragarlea egiteko tresna bat da, ikaskuntza sakonean oinarrituta dagoena.
  • RapidMiner, datu-meatzaritzarako ingurune bat da, Java programazio-lengoaian inplementatuta dagoena eta Wekarekin elkarreragiten duena.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. Ibarguren, Igor; Pérez, Jesús M.; Muguerza, Javier (2016-03-18) «J48Consolidated WEKA paketea, adibide ezohikoen patroiak identifikatzeko tresna» Ekaia. EHUko Zientzia eta Teknologia aldizkaria (29) ISSN 2444-3255 . Noiz kontsultatua: 2019-10-17.

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]