13
pages
Français
Documents
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
13
pages
Français
Documents
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
Informations sur le cours
9 (10) séances de 3h (Cours + TD/TP)•Cours
Polycopié“Bases de données” •
Transparents •
3° année (MISI)
Disponibles sur :
http://ouranos.inapg.inra.fr/wiki/
Antoine Cornuéjols
Attention : remises à jour fréquentes
www.lri.fr/~antoine
antoine.cornuejols@agroparistech.fr
2
IntroductionInformations sur le cours
PLAN Introduction
1. Qu’est-ce qu’une base de données ?
Sources bibliographiques•
2. Un système de gestion de base de données (SGBD)Andreas MEIER : “Introduction pratique aux bases de
données relationnelles”, Springer-Verlag, 2006 Pourquoi faire ?
Ramez ELMASRI & Shamkant NAVATHE :
3. Les grands principes et architecture
“Conception et architecture des bases de données”,
Pearson Education, 2004
4. Historique et évolution des SGBD
3 4 Introduction Introduction
Bases de données Bases de données
La bibliothèque de Leibniz (~ 1685) Définition (base de données) •
Une base de données est un gros ensemble d’informations •
structurées mémorisées sur un support permanent et qui peut être Caractéristiques
partagée par plusieurs applications et qui est interrrogeable par
Des données permanentes (livres) le contenu.
Un problème d’indexage
- Lourdeur d’accès : connaître le vs. Ensemble de fichiers détail de l’implantation physique•
Précis
- Manque de sécurité : N’importe Lourdeur d’accès aux donnéesFiable • qui peut modifier le fichier. Pas de
contrôle de cohérence.Supportant des mises à jour Manque de sécurité•
- Pas de contrôle de concurrence
entre utilisateurs.Pas de contrôle de concurrence•
5 6
Introduction Introduction
Système de Gestion de Bases de Données (SGBD) Bases de données vs. SGBD
Base de données Database
Définition (SGBD) 9Grande masse de données (Gigaoctets = 10 octets)
Un outil informatique permettant aux utilisateurs de structurer, Mémoire secondaire (disque dur, disque optique)
Liens abstraits/thématiques entre donnéesd’insérer, de modifier, de rechercher de manière efficace des données
Longévité des données (des dizaines d’années)spécifiques, au sein d’une grande quantité d’informations, stockées sur
mémoires secondaires partagée de manière transparente par plusieurs SGBD Database Management System (DBMS)
utilisateurs. Gestion du stockage des données
Traitement des données
Modification
Interrogation, extraction
Programmation d’applications
7 8 Introduction Introduction
Système de Gestion de Bases de Données (SGBD)Mémoire centrale vs. secondaire
Définition (SGBD) Mémoire centrale ou primaire ou vive
Un système de gestion de bases de données (SGBD) est un logiciel de Directement accessible par le processeur central
haut niveau qui permet de manipuler les informations stockées dans
Contient les instructions et les données d'un programme en exécution
une base de données.
Rapidité
Non persistance
Complexité (diversité des techniques mises en oeuvre) :
Modèles de donnéesMémoire secondaire ou persistante
Langages de requêtes
Indirectement accessible via des opérations d’entrée / sortie Techniques de stockage
Organisation des fichiers
Lenteur
Architecture
Persistance Optimisation des requêtes
Concurrence d’accès et reprise sur panne
9 10
Introduction Introduction
Système de Gestion de Bases de Données (SGBD) Architecture ANSI-SPARC
Vues de la BD
Schémas Externes (ES)
L4G : Lang. de 4° génération
ES ESES
Schéma conceptuel (CS)
Définition logique de la BD
CS
• Structures et types (LDD)
• Manipulations (LMD)
IS
Mémoire
Schéma interne (IS)secondaireSGBD SGBD Gestionnaire
externe interne • Représentation physiquedes fichiers
• Optimisations
11 12 Introduction Introduction
Objectifs des SGBD (1) Objectifs des SGBD (2)
Efficacité d’accès aux données :Indépendance physique des programmes et des données :
Optimisation : temps de réponse, débit, ...
Pouvoir modifier les schémas internes sans modifier les schémas conceptuels et externes Optimisation des opérations d’E/S
Indépendance logique : Redondance contrôlée des données :
Dans les BD réparties : redondance nécessaire, mais contrôléePouvoir modifier les schémas externes sans modifier les schémas conceptuels
Indépendance entre les différents utilisateurs Cohérence des données
Satisfaction de contraintes d’intégritéManipulation des données par des langages non procéduraux
Partage des donnéesDonnées facilement manipulables par les utilisateurs (interactifs ou programmeurs)
Permettre les accès concurrents
Administration facile des données
Sécurité des données
Outils pour définir et modifier les définition de données
Outils pour définir et modifier les définition de données
Protection en cas de panne (du SGBD, de la machine, ...)
Assurer l’atomicité des transactions et l’intégrité des données
13 14
Introduction Introduction
Applications Fonctionnalités d’un SGBD
Applications de gestion
1. Persistance
Banque - Finance - Assurance
2. Gestion du disque Gestion du personnel / client des entreprises
Gestion des stocks d’une entreprise commerciale
3. Partage des données
Système d’information d’une entreprise
4. Fiabilité des données
Applications transactionnelles
5. Sécurité des données
Gestion des réservations
6. Indépendance logique / physiqueTransport de passagers (train, avion, voiture, ...)
Hôtels, Spectacles 7. Langage de description, d’interrogation et de traitement des données
Consultation / modifications très fréquentes
15 16 Introduction Introduction
Fonctionnalités d’un SGBD Fonctionnalités d’un SGBD
3. Partage des données
1. Persistance Chaque utilisateur doit avoir l’illusion d’être seul
Notion de transaction (begin, abort, commit) Données stockées sur disque
Cohérence des mises à jour effectuées par un utilisateur
2. Gestion du disque Cohérence collective : sérialisabilité
Techniques spécifiques pour de bonnes performances 4. Fiabilité des données
Index, hash-coding Vérification de contraintes d’intégrité
Regroupement des données sur disque Atomiticité des transactions : transaction complètement effectuée ou pas du tout
Optimisation des requêtes Résistance aux pannes
Si panne mémoire : restauration automatique de la base intégrant les dernières transactions Cache-mémoire
validées avant la panne
Si panne disque : restauration d’une sauvegarde et déroulement du journal archivé
Mise en place d’un mécanisme de réplication synchrone de la base dans une base miroir :
mirroring
17 18
Introduction Introduction
Fonctionnalités d’un SGBD Fonctionnalités d’un SGBD
5. Sécurité des données 7. Langage de requête
Tous les utilisateurs ne peuvent pas tout faire sur toutes les données Les requêtes doivent être :
Notion de groupes d’utilisateurs Simples
Notion d’autorisation (lecture, écriture, exécution) Déclaratives
Granularité des autorisations : base de données, table, colonne, n-uplet, ... Optimisées avant leur exécution
Possibilité d’accorder ou de supprimer des droits
État de l’art :
6. Indépendance logique / physique SQL (Structured Query Language) : mélange d’algèbre relationnelle et de calcul relationnel
Organisation physique de la BD transparente pour le développeur d’application QBE (Query By Example) : s’appuie sur le calcul relationnel, mais permet de formuler des
requêtes et d’effectuer des manipulations de données à l’aide de représentations graphiques
On doit pouvoir changer la répartition des données sur le disque (ex : un
OQL (Object Query Language) : conçu pour s’intégrer avec des programmes écrits en langage regroupement ou la pose d’un index) sans changer le code de l’application ++objet (C , Smalltalk, Java)
manipulant les données
XQUERY (XML Query language)
19 20 Introduction Introduction
Conception d’une base de données Architecture ANSI-SPARC
Vues de la BD
Schémas Externes (ES)
L4G : Lang. de 4° génération
ES ESES
Schém