Eredu generatibo
Eredu generatiboa, entrenamenduko datu multzo batean oinarrituta, antzeko datu berriak sortzeko erabiltzen den eredu estatistikoa da. Eredu hauen helburu nagusia, sarrerako datuen probabilitate distribuzioa ikastea da, datuen berezko egitura ikasteko. Horrela, lagin berriak sor daitezke, adibidez, argazkiak edo testua.
Beraz, ereduaren funtzionamendua gainbegiratu gabeko ikaskuntzan oinarritzen da, X datu multzo bat emanda, multzo horren instantzia bakoitzaren distribuzioa P(x) bezala defini daiteke. Honek adierazten du ereduak x instantzia hori sortzeko probabilitatea edo eredua emanda x instantzia lortzeko probabilitatea.
Entrenamendua
[aldatu | aldatu iturburu kodea]Eredu generatiboen entrenamendua, hurrengo eran adierazitako datu multzoen bidez egiten da:
Helburua, dentsitate funtzioa lortzea da, non ereduaren parametro multzoa errepresentatzeko balio duen. Entrenamenduan, jasotako datuen egiantza maximizatzea da helburua. Egiantza hurrengo eran definitzen da:
.
Kalkuluak sinplifikatzeko log-egiantza (log-likelihood) erabiltzen da eta logaritmoen propietateei esker hurrengo eran adieraz daiteke:
.
Entrenamenduaren helburua parametro multzo optimoa aurkitzea da, non, log-egiantza maximoa den. Beraz:
.
Optimizazio prozesu hau teknika desberdinen bitartez egin daiteke eta eredu bakoitzaren araberakoa izango da, esate baterako, gradiente bidez edo galtze funtzio baten laguntzaz.
Ebaluazioa
[aldatu | aldatu iturburu kodea]Gainbegiratu gabeko ikaskuntzan dagoen arazo nagusienetariko bat, ereduen ebaluazioan datza, hau da, ereduaren kalitatea neurtzea. Gehienetan erabiltzen den estandarra, log-likelihood-a izan da, baina, eredu gehienen kasuetan, konputazionalki ezinezkoa da, horregatik, ezaugarrietara bideratutako hurbilketa bat gailentzen da kasu hauetan. Hurbilketa hauen artean, ereduen sorkuntzen irudikatzea indibidualki ebaluatzeko edo ereduen parametroen interpretazioak nabarmentzen dira.
Eredu diskriminatiboekiko alderapena
[aldatu | aldatu iturburu kodea]Eredu generatiboak, batez ere, datuak sailkatzeko ez ezik, datuak nola sortzen diren modelatzeko ere erabiltzen dira. Honek barneratzen du, besteak beste, jatorrizko datuen antzeko lagin berriak sortzea, anomalien detekzioa edo gainbegiratu gabeko ikaskuntzaren kasuan, ezkutuko patroiak aurkitzeko. Hala ere, eredu horiek mugak dituzte; izan ere, baterako banaketa osoa modelatzea suposizio eta konplexutasun konputazional asko eska ditzake, eta horrek zehaztasun gutxiago ekarri dezake sailkapen espezifikoko zereginetan. Kasu horietan, eredu diskriminatzaileak egokiagoak izaten dira; izan ere, sarreraren eta irteeraren arteko baldintzapeko harremanean soilik arreta jartzen dute, errendimendua optimizatuz, datuen egitura osoa modelatu gabe zehaztasunez sailkatzeko.
Motak
[aldatu | aldatu iturburu kodea]Eredu generatibo batzuk hauek dira:
- Sare Bayestarrak (Naive Bayes, LDA, etab)
- Markov eredu ezkutua
- Boltzmannen makina
- Nahaste ereduak
- Difusio ereduak
- Eredu autoregresiboak
Eredu horiek emaitza errealistak sortzeko gaitasuna partekatzen dute, datu-multzoaren azpiko probabilitateetan oinarritzen direlako, eta horrek erabilgarri bihurtzen ditu hainbat aplikaziotan, baita edukia klasifikatzeko eta eredu konplexuak identifikatzeko ere.
Erreferentziak
[aldatu | aldatu iturburu kodea]Kanpo estekak
[aldatu | aldatu iturburu kodea]- ↑ Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua. (2020-10-22). «Generative adversarial networks» Commun. ACM 63 (11): 139–144. doi: . ISSN 0001-0782. (Noiz kontsultatua: 2024-10-25).
- ↑ LAMB, Alex. A brief introduction to generative models. arXiv preprint arXiv:2103.00265, 2021.
- ↑ Theis, Lucas; Aaron van den Oord; Matthias Bethge. (2016-04-24). A NOTE ON THE EVALUATION OF GENERATIVE MODELS. , 1–10 or..