.
Réservé à l’organisme gestionnaire du programme
.
oDomaines émergents N de dossier : ANR-08-XXXX-00
Date de révision :
Document de soumission B Edition 2008
Acronyme ClasSel
Titre du projet Classification croisée et sélection de modèle
Proposaltitle Co-clusteringandmodelselection
Résumé
ClasSel est un projet de recherche académique qui vise à développer des méthodes de transformation de données
en connaissances. Les données en question se présentant sous la forme d’une matrice individus–variables, nous
cherchons à produire de la connaissance sous la forme de groupes homogènes de données associant conjointe-
ment les individus et les variables. C’est le problème de classification croisée. Nous envisageons d’attaquer ce
problème formellement à travers une modélisation probabiliste. Notre projet vise à adapter cette modélisation
aux problèmes spécifiques de la classification croisée pour les données de grande taille, une attention particulière
étant mise sur le problème, fondamental, du choix du nombre de groupes. C’est la question de la sélection de
modèle. À cette fin, nous comptons nous placer dans un cadre statistique nouveau et particulièrement bien
adapté. Nous nous proposons aussi de mettre en œuvre nos solutions sur des exemples concrets, comme le
challenge Netflix sur les systèmes de recommandation, et de traiter des applications en analyse automatique de
texte et en marketing.
Notre stratégie scientifique consiste à attaquer de front les questions de fond de la ...
Voir