Utilisation de mod èles de Markov cach és à grande marge dans la transcription d’émissions radiophoniques en langue Arabe Une étape fondamentale en reconnaissance automatique de la parole est le passage de l'onde sonore à une suite discrète d'unités phonétiques ou lexicales. Cette étape de reconnaissance acoustique est cruciale et influe sur les performances globales d'un système. Les modèles acoustiques représentent les éléments à reconnaitre, mots ou unités phonétiques, et sont généralement repr ésentés par des mod èles de Markov cach és à densité continue ( CDHMMs ), dont les paramètres sont obtenus par estimation au sens du maximum de vraisemblance (ML). Un grand intérêt de la méthode est l'existence d'algorithmes itératifs dont la convergence est garantie, comme l'algorithme EM qui est largement utilis é.Si la méthode ML améliore la capacité d'un classifieur à représenter une classe (modèle) de formes donnée, elle ne permet pas d'optimiser sa capacité à classer une forme inconnue, car l'apprentissage d'une classe ne prend pas en compte des formes appartenant à d'autres classes ni des contreexemples. L'id éal est de minimiser la variance intraclasse tout en maximisant les variances interclasses. Diverses méthodes d'apprentissage discriminant ont été conçues, fondées notamment sur : la maximisation de l'information mutuelle (MMI) entre un signal acoustique et la séquence de mots correspondante ...
Voir