Edukira joan

Eredu diskriminatzaile

Wikipedia, Entziklopedia askea

Eredu diskriminatzaileak, baldintzapeko eredutzat ere hartzen direnak, sailkatzeko maiz erabiltzen diren eredu-motak dira.  Normalean sailkapen bitarreko arazoak konpontzeko erabiltzen dira, hau da, dauden "datapointei" etiketak emateko, hala nola pasa/huts egin, irabazi/galdu, bizirik/hil edo osasuntsu/gaixo.

Eredu diskriminatzaileen artean erregresio logistiko (LR), baldintzapeko eremu aleatorioak (CRF), erabakiguneak daude beste askoren artean , etab. Eredu generatiboak probabilitate-banaketa bateratua erabiltzen du, hala nola, Naive Bayes sailkatzaile, Gaussiako nahasketa-ereduak, autokodegailu aldakorrak, sare antisorgailu generatiboak.

Modelizazio generatiboan ez bezala, honek baterako probabilitatea aztertzen du; hau da, P(x,y). Eredu diskriminatzaileko ikasketetan, ordea, baldintzatutako probabilitatea aztertzen da, P(y∣x), helburu aldagaia (y) kontuan hartzen duen eredua osatzeko. Adibidez, objektuen errekonozimenduan, x irudi baten pixel gordinen bektorea izan daiteke edo pixel horietatik ateratako ezaugarriak. Probabilitate-esparru batean, probabilitate banaketa baldintzatua modelatuz egiten da: P(y∣x). Banaketa baldintzatu hau erabiltzen da y iragartzeko x-tik abiatuta. Nahiz eta eredu baldintzatuak eredu diskriminatzaileetatik bereiz daitezkeen, sarritan azken hauen kategorian sartzen direla.

Eredu diskriminatzaile hutsa vs. eredu baldintzatua

[aldatu | aldatu iturburu kodea]

Eredu baldintzatzaile batek probabilitatearen banaketa baldintzatua ezartzen du,berrizm eredu diskriminatzaile tradizionalak sarrerako kartografia optimizatzea du helburu, lagin trebatu antzekoenen inguruan.[1]

Eredu diskriminatzaileen ikuspegi tipikoa

[aldatu | aldatu iturburu kodea]

Hurrengo planteamendua prestakuntzari buruzko datuak ematean oinarritzen da. D = { (xi​,yi​) ∣ i ≤ N,i ∈ Z} non ​ sarreraren irteera da eta ​ sarrera.[2]

Sailkatzaile lineala

[aldatu | aldatu iturburu kodea]

Erabili nahi dugun funtzioa da, entrenamendu-datuetan ikusten dugunaren portaera simulatzeko sailkatze linealaren bidez. Ezaugarri bateratuaren bektorea, , erabiliz, honela definitzen da erabaki-funtzioa:

Memisevicen interpretazioaren arabera[2], hau ere puntuazio-funtzio bat da,, Ekarpenaren bateragarritasuna neurtzen duen puntuazioa kalkulatzen du, irteera potentzialarekin eta inputarekin. Gero, funtzioak puntuazio handiena duen klasea zehazten du.

Erregresio logistikoa (LR)

[aldatu | aldatu iturburu kodea]

0-1 galeraren funtzioa erabakiaren teorian erabili ohi den bat denez, Probabilitate-banaketa baldintzatua,, prestakuntza-datuak optimizatzeko parametroen bektore bat denean, erregresio logistikoaren eredurako honako hau kontsidera liteke:


Goiko ekuazioak Erregresio logistikoa adierazten du. Ikus daiteke ereduen arteko bereizketa handi bat ondorengo probabilitatea sartzeko modua dela. Ondorengo probabilitatea eredu parametrikotik ateratzen da. Orduan parametroa maximiza dezakegu ekuazio honen bidez:

Ondorengo log_galera ekuazioak ere ordezka lezake:

Log-galera bereiz daitekeenez, eredua optimizatzeko gradientean oinarritutako metodo bat erabil daiteke. Optimo global bat bermatzen da funtzio objektiboa ganbila delako. Enbor-egiantzaren gradientea honela adierazten da:

non espero izango da

Aurreko metodoak sailkapen-kopuru erlatibo txikia eraginkortasunez zenbatzea ekarriko du.

Eredu generatiboarekin kontrastea

[aldatu | aldatu iturburu kodea]

Kontrastea planteamenduetan

[aldatu | aldatu iturburu kodea]

Demagun klaseko etiketak (sailkapena) eta ezaugarri aldagaiak ematen dizkigutela. , entrenamenduaren lagin gisa.

Eredu generatibo batek probabilitate bateratua hartzen du, non sarrera den eta etiketa den, eta etiketarik ezagunena iragartzen du aldagai ezezagunarentzat, Bayesen teorema erabiliz.[3]

Eredu diskriminatzaileek, Eredu generatiboek ez bezala, ez dute uzten aldagai behatu eta objektiboen banaketa bateratutik laginak sortzen. Hala ere, banaketa bateratua eskatzen ez duten sailkapen eta erregresio-analisi eginkizunetarako, eredu diskriminatzaileek errendimendu handiagoa eman dezakete (neurri batean, kontuan hartu beharreko aldagai gutxiago dituztelako)[3]. Bestalde, eredu generatiboak eredu diskriminatzaileak baino malguagoak izan ohi dira ikaskuntza-lan konplexuetan mendekotasunak adieraztean. Gainera, eredu diskriminatzaile gehienak bere baitan gainbegiratzen dira, eta ezin diote erraz eutsi gainbegiratu gabeko ikaskuntzari. Aplikazioari buruzko xehetasunek, azken batean, eredu generatiboaren aurrean diskriminatzaile bat hautatzeko egokitasuna adierazten dute.


Eredu diskriminatzaileak eta eredu generatiboak ere desberdinak dira ondorengo aukera ezartzean[4]. Eredu diskriminatzailean, ondorengo probabilitatea, , eredu parametriko batetik ateratzen da, non parametroak entrenamenduaren datuetatik datozen. Parametroen zenbatespen-puntuak probabilitatearen maximizaziotik edo parametroen gaineko banaketaren zenbaketatik lortzen dira. Bestalde, kontuan hartuta eredu generatiboak probabilitate bateratuan oinarritzen direla, klasearen ondorengo probabilitatea Bayesen teorematzat hartzen da, hau da,

[5]

Abantailak eta desabantailak aplikazioan

[aldatu | aldatu iturburu kodea]

Errepikatutako esperimentuetan, erregresio logistikoa eta Naive Bayes eredu desberdinetarako aplikatzen dira sailkapen bitarreko zereginean, ikaskuntza diskriminatzaileak errore asintotiko baxuagoak sortzen ditu, eta sortzaileak, berriz, errore asintotiko altuagoak eta azkarragoak[3][6] [5]. Hala ere, Ulusoy eta Bishop ikertzaileek, Comparison of Generative and Discriminative Techniques for Object Detection and Classification artikuluan baterako lanean baieztapen hori egia dela diote soilik eredua datuetarako egokia denean (hau da, datuen banaketa eredu sortzaileak modelatzen du).

Diskriminazio-ereduak erabiltzearen abantaila nagusiak hauek dira:

  • Zehaztasun handiagoa, kasu gehienetan ikaskuntza-emaitza hobea izatera eramaten duena.
  • Sarrera sinplifikatzeko aukera ematen du, eta .
  • Aurreztu kalkulu-baliabideak.
  • Akats asintotiko txikiagoak sortzen ditu.

Modelatze sortzailea erabiltzearen abantailekin alderatuta:

  • Datu guztiak hartzen ditu kontuan, eta horrek prozesamendu motelagoa ekar lezake, desabantaila gisa.
  • Entrenamendu-lagin gutxiago behar dira.
  • Esparru malgua, aplikazioaren beste premia batzuekin erraz lankidetzan aritzeko modukoa.

Desabantailak

[aldatu | aldatu iturburu kodea]
  • Entrenamendu-metodoak zenbakizko optimizazio-teknika ugari behar izaten ditu[1]
  • Era berean, definizioaren arabera, eredu diskriminatzaileak azpizeregin anitzen konbinazioa beharko du mundu errealeko arazo konplexu bat konpontzeko.[2]

Optimizazioak aplikazioetan

[aldatu | aldatu iturburu kodea]

Bi modelatze-moduek abantailak eta eragozpenak dituztenez, bi ikuspegien konbinazioa ondo modelatuko da praktikan. Adibidez, Marras A Joint Discriminative Generative Model for Deformable Model Construction and Classification artikuluan, [7] berak eta bere egilekideek modelatutako bi konbinazioa aplikatzen dira modeloen aurpegien sailkapenean, eta doitasun handiagoa lortzen dute ikuspegi tradizionalarekin alderatuz.

Antzera, Kelmek[8] pixelak sailkatzeko bi modelaturen konbinazioa ere proposatu zen Combining Generative and Discriminative Methods for Pixel Classification with Multi-Conditional Learning artikuluan.

Taldekatu aurreko ezaugarri diskriminatzaileak erauzteko prozesuan, osagai nagusien analisia (PCA), normalean erabiltzen bada ere, ez da nahitaez ikuspegi diskriminatzailea. Aitzitik, azterketa lineal diskriminatzailea ikuspegi diskriminatzailea da[9], eta lehen aipatu ditugun desabantailak ezabatzeko modu eraginkorra ematen du. Dakigunez, eredu diskriminatzaileak azpizeregin anitzen konbinazioa behar du sailkapena egin aurretik, eta LDAk konponbide egokia ematen dio arazo horri dimentsioa murriztuz.

Hona hemen eredu diskriminatzaileen adibideak:

Erreferentziak

[aldatu | aldatu iturburu kodea]
  1. a b Ballesteros, Miguel. "Discriminative Models" (PDF). Retrieved October 28, 2018
  2. a b c Memisevic, Roland (December 21, 2006). "An introduction to structured discriminative learning". Retrieved October 29, 2018.
  3. a b c Ng, Andrew Y.; Jordan, Michael I. (2001). On Discriminative vs. Generative classifiers: A comparison of logistic regression and naive Bayes
  4. Ulusoy, Ilkay (May 2016) "Comparison of Generative and Discriminative Techniques for Object Detection and Classification" (PDF). Microsoft. Retrieved October 30, 2018
  5. a b J. Lafferty, A. McCallum, and F. Pereira. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. In ICML, 2001.
  6. Singla, Parag; Domingos, Pedro (2005)."Discriminative Training of Markov Logic Networks". Proceedings of the 20th National Conference on Artificial Intelligence - Volume 2. AAAI'05. Pittsburgh, Pennsylvania: AAAI Press: 868–873. ISBN 978-1577352365.
  7. Marras, Ioannis (2017). "A Joint Discriminative Generative Model for Deformable Model Construction and Classification" (PDF). Retrieved 5 November 2018.
  8. Kelm, B. Michael. (PDF). "Combining Generative and Discriminative Methods for Pixel Classification with Multi-Conditional Learning" Archived from the original (PDF) on 17 July 2019. Retrieved 5 November 2018.ombining Generative and Discriminative Methods for Pixel Classification with Multi-Conditional Learning
  9. Wang, Zhangyang (2015)."A Joint Optimization Framework of Sparse Coding and Discriminative Clustering" (PDF). Retrieved 5 November 2018.