La parole numérique, analyse, reconnaissance et synthèse du signal vocal , livre ebook

icon

53

pages

icon

Français

icon

Ebooks

icon jeton

Vous pourrez modifier la taille du texte de cet ouvrage

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe et accède à tout notre catalogue !

Je m'inscris

Découvre YouScribe et accède à tout notre catalogue !

Je m'inscris
icon

53

pages

icon

Français

icon

Ebooks

icon jeton

Vous pourrez modifier la taille du texte de cet ouvrage

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

La reconnaissance automatique de la parole donne lieu à un ensemble d’applications de nature et de difficulté très variées, concernant quotidiennement des millions de personnes. Elle fait appel à des notions variées allant des mathématiques, du traitement du signal, de l’informatique et de l’intelligence artificielle jusqu’à la phonétique, la linguistique, les sciences cognitives et les neurosciences.
L’ouvrage présente les fondements du domaine ainsi que les différents modèles et algorithmes utilisés (statistiques, neuromimétiques, symboliques).
Les domaines d’application sont également étudiés : dictée, commandes, télématique, traduction, etc.

Jean-Paul Haton, agrégé de l’Université (Ecole Normale Supérieure de Saint-Cloud) et Docteur d’état ès Sciences, est professeur émérite à l’Université de Lorraine à Nancy et chercheur au LORIA/INRIA. Il est membre senior de l’Institut Universitaire de France, Vice-Président de l’Académie Lorraine des Sciences et membre associé de l’Académie Royale de Belgique.

Voir icon arrow

EAN13

9782803105298

Langue

Français

LA PAROLE NUMÉRIQUE
Jean-Paul Haton
La parole numérique Analyse, reconnaissance et synthèse du signal vocal
Académie royale de Belgique
rue Ducale, 1 - 1000 Bruxelles, Belgique
www.academieroyale.be
Informations concernant la version numérique
ISBN : 978-2-8031-0529-8

© 2016, Académie royale de Belgique
Collection L’Académie en poche
Sous la responsabilité académique de Véronique Dehant
Volume 79
Diffusion
Académie royale de Belgique
www.academie-editions.be
Crédits
Conception et réalisation : Laurent Hansen, Académie royale de Belgique
Couverture : © Aniwhite, Shutterstock
Publié en collaboration avec
Introduction
Le traitement automatique de la parole recouvre un vaste ensemble d’activités, souvent complémentaires, que l’on peut classer en six grands thèmes : — codage et compression de la parole, intervenant en transmission et en restitution de la parole, — synthèse de la parole, produisant un signal vocal à partir d’un dictionnaire d’éléments phonétiques et/ou de règles, — reconnaissance de la parole, revenant à faire interpréter par une machine des mots ou des phrases prononcés par un locuteur humain dans le but de réaliser une action précise, — reconnaissance et vérification du locuteur, problème dual du précédent dans lequel on cherche à authentifier une personne par sa voix, — identification de la langue dans laquelle une personne s’exprime, — détermination de l’état émotionnel d’un locuteur.
Ces différents thèmes ne sont pas indépendants les uns des autres. Ils se trouvent souvent utilisés simultanément au sein d’une application.
Ainsi, un système de dialogue oral comporte des modules de reconnaissance, de synthèse et éventuellement d’identification des locuteurs ou de la langue dans laquelle ces derniers s’expriment. Ces techniques permettent de mettre en œuvre des interfaces homme-machine (IHM) dans lesquelles une part importante de l’interaction utilise la voix.
Chapitre 1
La communication parlée
La communication parlée permet le transfert d’informations d’une personne à une autre par le biais de la parole. Ce mode de communication est primordial pour l’être humain. Cela le distingue des autres animaux et, en outre, langage et développement culturel sont inséparables. Les moyens technologiques ont étendu la portée de cette communication, d’une part en proposant de nouveaux vecteurs tels que téléphone, radio, télévision, Internet, et d’autre part en introduisant la communication orale homme-machine en complément de la communication entre humains.
Le signal acoustique de parole résulte des variations de pression de l’air au niveau de la bouche et du nez d’un locuteur. Ce signal transporte un ensemble d’informations linguistiques relatives au message que le locuteur veut faire parvenir, ainsi que des informations sur son identité, son état, etc. On peut distinguer quatre grandes étapes dans le processus de la communication parlée : — Intention : le locuteur transforme l’idée qu’il désire transmettre en une structure linguistique formée des mots adéquats. — Articulation : la structure linguistique est transformée en une suite de commandes motrices pour les organes articulateurs. — Émission : l’onde vocale est produite par le mouvement des muscles articulateurs et se propage dans l’air depuis la bouche du locuteur. — Perception : l’onde vocale parvient aux oreilles d’un auditeur. Elle est alors transformée en impulsions nerveuses transmises au cerveau de façon à être comprise par l’auditeur.
L’ensemble des processus ci-dessus constitue la chaîne de communication parlée. 1. La production de la parole
La parole est produite par les mouvements de l’appareil phonatoire. Cet appareil se compose de deux parties distinctes, une source et un canal. La source d’énergie utilisée pour produire les sons est l’air contenu dans les poumons. Le flux d’air sous pression passe à travers la trachée et parvient au conduit vocal qui comprend le larynx avec les cordes vocales, des cavités résonantes plus ou moins déformables (pharynx ; cavité buccale et fosses nasales pouvant être mises en communication grâce au voile du palais) et des organes d’articulation (langue, lèvres, mâchoires, etc.) permettant d’obturer le canal vocal ou d’en modifier la forme. 2. Les sons élémentaires du français
Les sons élémentaires de parole peuvent être classés en fonction de trois variables : le voisement (activité des cordes vocales), le mode d’articulation (type de mécanisme de production) et le lieu d’articulation (endroit de resserrement maximal du conduit vocal). ...

Voir icon more
Alternate Text