Classification au pluriel Classification non supervisée Classification supervisée Mise à disposition par MIXMOD Pourquoi les modèles de mélange pour la classification ? C. Biernacki e2 rencontre MIXMOD – 4 décembre 2008Classification au pluriel Classification non supervisée Classification supervisée Mise à disposition par MIXMOD Outline 1 Classification au pluriel Diversité des objectifs Pourquoi les modèles de mélange? 2 Classification non supervisée Rappel sur des méthodes très répandues Exemple du modèle de mélange gaussien 3 Classification supervisée Rappel sur des méthodes très répandues Exemple du modèle multinomial avec indépendance conditionnelle 4 Mise à disposition par MIXMODClassification au pluriel Classification non supervisée Classification supervisée Mise à disposition par MIXMOD Diversité des objectifs Classification non supervisée : principe général Trouver une partition dans un jeu de données ... 6 5 4 4 3 2 2 1 00 −→ −1 −2−2 −3 −4 −4 −5 −6 −6 −4 −2 0 2 4 6 −6 −4 −2 0 2 4 6 8 ...afin de synthétiser des données complexes et volumineusesClassification au pluriel Classification non supervisée Classification supervisée Mise à disposition par MIXMOD Diversité des objectifs Classification non supervisée : exemples Industrie : contrôle de cuve Sociologie : absences d’employés 100 Données d’absentéisme dans les collectivités (mairies, etc.) 80 60 150 40 100 20 0 50 −20 0 800 −40 600 1 0.8 400 0.6 −60 0.4200 0.2 0 0 −80 Montant remboursé par jour −100 −50 0 50 100 150 Jours ...
Unebonnepartition est composée de classesinterprétables: Une classe de craquements indique undéfautdans la cuve Une classe d’employés suggère unecause d’absence similaire
50
100
−50
0
100 80
60 40 20 0 −20 −40 −60 −80 −100
Sociologie: absences d’employés
Données d'absentéisme dans les collectivités (mairies, etc.)
150
Industrie: contrôle de cuve
50
100
600 1 0.8 4000.6 200 0.4 0.2 0 0 150 remboursés (%) JoursMontant remboursé par jour
0 800
4
6
?
. . . afin declasserde nouvelles données sans étiquettes
1 2 3
2 0 −2
−4
−6 −6
−4
−2
0
5 4 3 2 1 −→0 −1 −2 −3 −4 −5 2 4 6 −4 −2 0
2
Trouver unepartitionde l’espace complet . . .
Diversité des objectifs Classification supervisée : principe général