Dendrograma

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Estatistikan, dendrograma, grekera klasikozko dendron, "zuhaitz", -gramma, "marrazki", hitzetatik, zuhaitz erako diagrama da. Multzokatze tekniken jomuga da: dendrogramak elementu ezberdinen bilketa eta osatutako multzoak erakusten ditu, elementu eta multzo ezberdinen arteko distantziak azalduz. Distantziak elementuen gainean jasotako datuetan oinarrituz kalkulatzen dira. Adibide gisa, hona dendrograma bat:


--0---------10---------20---------30---------40---------50---------60
A--------|
         |---------------------------------------|
B--------|                                       |
                                                 |-------|
C-------------------------------|                |       |
                                |----------------|       |
D-------------------------------|                        |----------
                                                         |
                                                         |
E--------------------------------------------------------|


Arestiko dendrograman, A, B, C, D eta E elementu, objektu edo banakoen elkarketak eta ondorengo multzoen bilketak azaltzen dira. Ardatz horizontalean distantziak azaltzen dira. Elementu antzekoenak A eta B dira, distantzia txikienera elkartzen direnak direlako. Bi multzo bereizten da A-B alde batetik eta C-D bestetik, multzo homogenoena A-B izanik, distantzia txikienera agertzen den multzoa delako. Elementu berezi bat, beste elementuekin antz handirik ez duena edo beste elementuetarako distantzia handia duena badago: E elementua.

Eraketa[aldatu | aldatu iturburu kodea]

Clusters.PNG
Hierarchical clustering diagram.png

Dendrograma baten eraketa hobeto ulertzeko, ezkerreko irudia har daiteke, non elementu ezberdinak azaltzen diren. Elementuen arteko distantzia euklidearrak beraien arteko ezberdintasunaren neurri moduan hartzen badira, eskubiko dendrograma era daiteke. Elementu gertuenak, antzekoenak alegia, b-c eta d-e dira neurri berean. Hau dela eta, lehenengo pausoan biltzen diren elementuak lirateke, multzo ezberdinak osatuz. Ondoren, distantzia txikienera dagoen elementua f da, d-e multzotik zehatzago, eta horregatik biltzen dugu multzo horretara. Jarraian, b-c eta d-e-r multzoak biltzen dira, hurrengo distantzia txikiena beraien artekoa delako. Azkenik, urrutien dagoen a elementua biltzen da.