1 Classiflcation par blocs sous l’approche modele de m¶elange Mohamed Nadif (a) and G¶erard Govaert (b) (a)CRIP5, Universit¶e Paris Descartes (b) HEUDIASYC, UMR CNRS 6599, Universit¶e de Technologie de Compiegne 08 mars 20072 Histoire de la Classiflcation o Apprentissage non supervis¶e : classiflcation automatique o La classiflcation automatique ofire une vue simplifl¶ee d’un ensemble de donn¶ees en le structurant en classes homogenes o Outil indispensable dans la fouille de donn¶ees o D¶emarche naturelle et ancienne Aristote : classiflcations en logique et en politique Linn¶e en 1763 : classiflcation complete des ^etres vivants Darwin 1859 : interpr¶etation de l’¶evolution des especes Apres 1960 : apparition des algorithmes automatisant la construction des classes3 Objectifs de la Classiflcation o Donn¶ees jSoit x=(x ) la matrice des donn¶ees de taille r£si i2I l’ensemble des r lignes (individus, objets, instances) j2J l’ensemble des s colonnes (variables, attributs) I Premier objectif : classiflcation simple R¶esumer l’information en utilisant des classes d’individus "homogenes"a l’aide d’une partition sur l’ensemble I I Second objectif : classiflcation crois¶ee R¶esumer l’information en utilisant des blocs homogenes a l’aide d’une paire de partitions d¶eflnies sur l’ensemble I et l’ensemble J4 Exemple : Donn¶ees binaires o I =fA;B;C;D;E;F;G;H;I;Jg et J =f1;2;3;4;5;6;7g o Classiflcation simple : (fA;C;Hg;fB;F;Gg;fD;G;I;Eg) o Classiflcation crois¶ee : { classes en ligne (fA;C;Hg ...
IL’algorithme CAH – Chaque point est dans sa propre classe –Achaqueite´ration,onagglom`erelesclasseslesplusprochesausensd’une distancead’`’irfin´e –Onre´pe`teceprocessusjusqu’a`obteniruneseuleclasse IPblrome`estgirm´hegeationetcompiloedxxictu´ierd`etlr’eadlegoar’ch:
5
Me´thodesdePartionnement
❏elliaT´nnodsedeeegsardn→tionnemedesdepar´Mteohtn
❏Recherche d’une partition enkclasses
6
➭partredenombe:leix´tlpe´Cmoeedblemnsne’udselbissopsnoitinindividus eng classes