Catalogues et Web - Support de cours BDNT-

icon

7

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

7

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

‰‰‰Catalogues et Web - Support de cours BDNT- 1 Elizabeth Cherhal, Février 2001, revu Février 2004 Plan du cours: Première Journée Catalogues et Web - Support de cours BDNT- 1 .................................................................................................... 1 Objectif du cours..................................................................................................................................................... 1 Rappels de la problématique "catalogues et web"................................................................................................... 1 Le SGBD (Système de gestion de bases de données) ......................................................................................... 1 Langage de requête, interface utilisateur et "OPAC"............................................................................ 1 Les Systèmes intégrés de gestion de bibliothèques (SIGB) ................................................................................ 2 L'architecture Client/Serveur .................................................................................................................................. 2 Le système client/serveur Web......................... 2 L'interaction web/base de données...................................................................................................................... 3 Pages dynamiques, et "programmes web"....................................................... ...
Voir icon arrow

Publié par

Langue

Français

Catalogues et Web - Support de cours BDNT- 1
Elizabeth Cherhal, Février 2001, revu Février 2004
Plan du cours: Première Journée
Catalogues et Web - Support de cours BDNT- 1 .................................................................................................... 1
Objectif du cours..................................................................................................................................................... 1
Rappels de la problématique "catalogues et web"................................................................................................... 1
Le SGBD (Système de gestion de bases de données) ......................................................................................... 1
Langage de requête, interface utilisateur et "OPAC"...................................................................................... 1
Les Systèmes intégrés de gestion de bibliothèques (SIGB) ................................................................................ 2
L'architecture Client/Serveur .................................................................................................................................. 2
Le système client/serveur Web ........................................................................................................................... 2
L'interaction web/base de données...................................................................................................................... 3
Pages dynamiques, et "programmes web"....................................................................................................... 3
Un exemple concret: le Catalogue Fusionné des Périodiques de Mathématiques........................................... 4
Enrichissement, ou "le web vous en donne plus"............................................................................................ 5
Solution clés en mains............................................................................................................................................. 5
Solutions "libres" .................................................................................................................................................... 6
2ème journée:
Catalogues collectifs, catalogues fusionnés et accès multi-bases réparties
‰
Catalogues collectifs et catalogues fusionnés
‰
La norme Z39.50
‰
Accès aux nouvelles ressources
Objectif du cours
L'objectif du cours est de fournir aux bibliothécaires/documentalistes chargés de la mise en place d'un accès web
à leur catalogue informatisé les éléments d'information nécessaires au choix de celui ci. Il peut également
éclairer des responsables informatiques quant aux choix techniques à effectuer.
Rappels de la problématique "catalogues et web"
Les bibliothèques disposent généralement d'un système permettant le catalogage de leur fonds, ainsi qu'un
certain nombre d'autres opérations de gestion de celui-ci: gestion du prêt, des lecteurs, commandes, relances,
réservations… et elles aimeraient avoir la disponibilité de ce système, via l'outil universel grand public, à savoir
le navigateur web. Elles aimeraient par ailleurs proposer à leurs lecteurs des possibilités de recherche de
documents, à la fois dans et en dehors de leurs fonds. Ce cours se propose d'aborder les solutions techniques
sous-jacentes à cet objectif.
Le SGBD (Système de gestion de bases de données)
Tout système documentaire est basé sur un système de gestion de base de données. C'est le SGBD qui permet de
stocker les données de manière à ce qu'elles puissent être retrouvées et de gérer un certain nombre de tables et
index, permettant la recherche rapide de l'information.. Les logiciels actuellement commercialisés sont basés soit
sur des SGBD reconnus pour la gestion des données "factuelles" (non spécifiquement documentaires) tels
qu'
oracle
, soit sur des SGBD "maison", inventés par l'éditeur du logiciel même.
Langage de requête, interface utilisateur et "OPAC
1
"
Le SGBD comporte toujours un langage de requêtes permettant d'introduire, ranger, et extraire les données dans
la base. Le langage de requêtes le plus connu est "
SQL
2
", langage "universel" d'accès aux bases de données, et à
l'aide duquel on peut accéder par exemple aux SGBD tels que:
oracle, access, postgres, MySql
, etc…
1
Online Public Access Catalog
2
Structured Query language
1
Parfois le langage de requête est conçu par le seul inventeur du logiciel.. Pour ceux qui connaissent le logiciel
"
texto
", ses commandes en mode "ligne" constituent un exemple de langage de requêtes "maison".
A côté du langage de requête proprement dit, il existe
l'interface utilisateur
, destiné au gestionnaire de la base
(à ne pas confondre avec l'utilisateur final). Généralement celui ci dispose d'une interface graphique, composée
de fenêtres, de boutons et de menus. A l'aide de ceux ci il va pouvoir effectuer plus ou moins facilement les
opérations de catalogage, d'interrogation, de mise à jour,… de sa base.
Destiné à l'utilisateur final, certains logiciels comportent en plus une interface simplifiée, permettant seulement
l'extraction de l'information par un utilisateur pour ses besoins. Cette interface s'appelle "
OPAC
", et se présente
de plus en plus aujourd'hui sous forme de "module web", consultable à travers le navigateur, devenu outil de
consultation universel pour le "chercheur d'information".
"L'OPAC web" va dans tous les cas interagir avec la base à travers son langage de requête natif et produire les
résultats sous forme compréhensible par le navigateur web.
Les Systèmes intégrés de gestion de bibliothèques (SIGB)
Ces systèmes peuvent être considérés comme une extension du SGBD classique. Par le biais de liens entre
différentes tables, elles vont permettre une gestion de toutes les opérations nécessaires à une bibliothèque:
Commande, catalogage, prêt, gestion les lecteurs, parfois catalogage "réparti" (ou commun), relances, nouvelles
acquisitions, statistiques….
Plus il y a de fonctions possibles, plus la définition de la base sous-jacente est compliquée, plus le
développement et la maintenance de l'application coûte cher.
Cela explique en partie le coût important des SGIB tels
qu'Aleph, OPSYS, ABSYS, GEAC
, etc…
Un exemple de système de gestion intégré est donné à travers l'application "LGD".
(http://www-mathdoc.ujf-grenoble.fr/LGD/LGD.html)
L'architecture Client/Serveur
L'architecture client/serveur repose sur l'existence de
réseaux
, et de
protocoles.
Un réseau
est une infrastructure permettant l'interconnexion d'ordinateurs.
Un protocole
est un langage défini permettant à deux ordinateurs (ou deux applications sur des ordinateurs
disants ou non) de communiquer.
Les SGBD eux-mêmes reposent le plus souvent sur l'architecture client/serveur. Une partie serveur reçoit des
requêtes d'une ou plusieurs parties clientes, les traite, et renvoie les résultats qui sont traités (affichés) par la
partie cliente.
Pour comprendre le fonctionnement d'une application web/SGBD, nous devons d'abord avoir en tête le
fonctionnement client/serveur du web.
Le système client/serveur Web
Le système web repose essentiellement sur deux bases:
‰
Le prototcole http (hypertext transfer protocol)
‰
Le langage html (hypertext markup language) , langage qui est compris et interprété par les navigateurs.
A travers le réseau, le serveur (le programme httpd, (hypertext transfer protocol daemon)) et le client (le
navigateur : mozilla, IE ou autres) communiquent par des requêtes et des ressources (« pages » ou fichiers)
renvoyées en fonction de ces requêtes. Tout ce que nous, utilisateurs, obtenons via le web passe avant tout par un
schéma de ce type.
2
L'interaction web/base de données
Le schéma ci dessus montre la manière dont on obtient via le web une ressource statique. Une ressource statique
est typiquement un fichier (écrit en html, ou un autre format tel que pdf, ou image) et mis dans un répertoire du
serveur web pour être envoyé aux clients. Mais que se passe-t-il quand les données que l'on veut obtenir ne sont
pas sous cette forme de simple fichier, mais déjà rangées dans une base de données, non directement accessible
par le serveur web (qui comprend en gros un type de langage, "donne-moi ceci ou cela") ?
Pages dynamiques, et "programmes web"
Pour interagir avec des ressources "non web" telles que les bases de données, nous devons passer par un ou
plusieurs programmes. Le rôle de ces programmes va être de lire les données saisies par l'utilisateur, les traduire
dans le langage de requête de la base, interroger celle ci, extraire l'information, le renvoyer, et le traduire en un
langage affichable par le navigateur (actuellement l'html).
3
Un exemple concret: le Catalogue Fusionné des Périodiques de Mathématiques
Le catalogue fusionné est composé d'un ensemble de tables figurant ci dessous:
Bibliothèques
Périodiques
Numéro
Nom
URL
Clé
ISSN
Titre
12
Lille
www.lille.fr/bib
math
324
1542-9857
New Scientist
Etats Périodiques
Numéro
Bibliothèque
Clé
Périodique
Etat Collection
12
324
10 (1984) - 11 (1986)
URL Périodiques
Périodiques Services
Sommaires
Clé
Périodique
N° Service
Clé
Périodi
-que
URL
Type URL
324
2
324
Mad-Scientists.com
J
Services
Sommaires
N° Service
Nom service
4
Schématiquement,
le programme d'interrogation de la base "Catalogue fusionné" effectue les opérations
suivantes:
L ’utilisateur demande un mot du titre
Le programme trouve les notices répondant à la question
Les réponses (pour chaque notice, la clé et les différents champs) sont stockées dans un tableau
Pour chaque clé de notice on voit s ’il y a un état de collection, et on trouve le numéro de la bibliothèque
On trouve les noms de bibliothèques correspondant aux numéros
Pour chaque clé de notice on voit s ’il y a un service de sommaire
Pour chaque clé de notice on voit s ’il y a un ou plusieurs urls
A partir de ces données, les hyperliens nécessaires sont construits à la volée
S'il y a plusieurs réponses à la question, on construit une liste de réponses (« notices courtes ») avec les
titres, urls associés et noms de bibliothèques, on utilise la clé de la notice pour construire un url qui va
"rebondir" sur la base.
S'il n'y a qu'une réponse, on affiche directement la notice.
Dans chaque notice on voit s ’il y a des notices liées
Si oui, on construit à la volée l'hyperlien "rebond"
Etc…
Enrichissement, ou "le web vous en donne plus"
Puisque nous allons passer les données brutes extraites de la base par un programme, et opérer un certain nombre
de transformations au passage sur le contenu de ces données, il nous sera relativement facile de les agrémenter
de différents hyperliens, que notre programme va générer automatiquement:
‰
Les "
renvois internes
" à la base, ou "rebonds":
En repérant dans le résultat que l'on récupère de la base le contenu de tel ou tel champ (l'auteur, les mots-
clés, la collection) nous allons pouvoir générer automatiquement un nouvel appel à notre propre programme,
en utilisant ces données comme nouvel argument
‰
Les liens sur des
ressources extérieurs
, autres bases, "documents liés", etc…
‰
Autres bases
: Nous pouvons parfois nous servir d'un identifiant unique présent dans nos données (tel
que le numéro issn ou isbn) pour générer un appel à un autre programme en utilisant ce numéro comme
argument. Exemple, si on possède un numéro issn on peut construire l'url permettant d'interroger sur ce
numéro précis des bases telles que l'inist, peut-être le SU, etc…
‰
Documents liés
: Le principe le plus simple consiste à avoir dans sa base des références (urls
généralement) d'autres documents, se trouvant sur notre web ou ailleurs, et des les inclure de manière
cliquable dans notre notice résultat. Au delà de cette simple possibilité, de nombreuses autres sont
proposées dans de nombreuses applications. Toutes se basent sur la manière de déduire un url d'un
identifiant unique présent dans les données.
Les possibilités du web ne sont pas infinies, mais l'imagination et la créativité en font un outil fascinant à
exploiter.
Solution clés en mains
Revenons sur terre, dans notre bibliothèque, qu'allons nous faire pour pouvoir disposer de toutes ces merveilles?
Généralement, si nous avons un logiciel documentaire ou de gestion de bibliothèque, nous allons acheter la
solution proposée par notre fournisseur. Celui ci ne proposera peut-être pas toutes les fonctionnalités voulues. Il
convient d'étudier quelles fonctionnalités nous sont surtout utiles:
Parmi les fonctionnalités proposées ou non proposées on peut citer:
interrogation du catalogue via les champs les plus importants
possibilités d'exploitation d'opérateurs booléens, et/ou de proximité
recherche de mots ou de chaînes
"navigation" à travers des index d'auteurs, de mots clés, de codes de classification
fonctions "rebonds" à partir de morceaux de notice
gestion des "documents liés" (s'il y en a)
accès "intégré" à des ressources extérieurs depuis une notice du catalogue
informations sur le prêt et la disponibilité d'un ouvrage
gestion personnalisée des lecteurs
profils de recherche personnalisés, services d'alertes.
5
etc…
Les possibilités dépendent en fait très étroitement de ce que le logiciel de base a prévu. En principe, si vous
pouvez le faire en dehors du web (via l'interface gestionnaire) vous pouvez techniquement le faire via le web.
Une restriction cependant, la nature même de l'intéraction client/serveur web rend difficile la notion de "session"
et "d'historique". Ces fonctionnalités vous seront proposés en supplément, car elles vont nécessiter un
développement spécifique.
Selon ce qui a déjà été fait par votre fournisseur et ce qui vous paraît indispensable, il va falloir faire un tri.
En tant que client, vous devez pouvoir assurer vous même une grande partie du paramétrage: aspect des pages,
masque d'interrogation, aspect de la liste de résultats, aspect des notices.
Vous devez pouvoir aussi demander un nombre important de fonctions "rebonds".
Par contre, sachez que lorsque vous vous aventurez dans les données annexes à celles de la notice (exemplaires,
lecteurs, etc…il faudra mesurer vos desiderata en termes d'espèces sonnantes et trébuchantes.
Solutions "libres"
Ici nous ne parlons pas de
logiciels de gestion de bibliothèques libres
tels que
Koha
3
, PhpMyBibl
4
i, ou LGD
5
,
qui comportent leur interface web, nous parlons d’une solution permettant de mettre sur le web le contenu d’une
base lorsque le logiciel qu’on possède n’en dispose pas.
Il faut être conscient qu'une solution libre nécessite un développement, et doit toujours être considérée comme
un problème de "qualité prix" ou "service à assurer à tout prix".
Grossièrement les solutions libres sont de 2 natures, et nécessitent toujours un export et un retraitement des
données:
‰
Export des données du logiciel "natif" et utilisation d'un logiciel d'indexation libre tel que "
wais
6
,
"
glimpse
7
",
swish
8
. Les index crées par ces logiciels sont à leur tour interrogeables par des programmes web,
plus
ou
moins
paramétrables,
et
qui
"viennent
avec".
L'exemple
le
plus
connu
de
l'export/réindexation/interro web est celui constitué par l'indexeur wais et l'interface web Sfgate encore en
service dans quelques (rares) labos.
Un exemple d'une base wais reconsitué peut être trouvé à Paris 13..
‰
http://www-math.math.univ-paris13.fr/laga2/bibli/livres/ancien/index.html
‰
Export des données du logiciel "natif" réincoporation dans une SGBD disponible gratuitement tel que
MySql
9
,
msql
10
, ou
postgresql
11
. On dispose alors pour ces SGBD d'applications web presque toutes faites
permettant de se faire une petite interface sans trop de douleur.
Un exemple de base réintroduite dans msql peut être trouvée à la bibliothèque de math de nice.
http://www-math.unice.fr/BIBLIO/
Note : Ces deux solutions sont devenues rares, car la plupart des logiciels comportent une interface web
aujourd’hui.
La "solution libre", essentiellement parce qu'elle repose sur le principe d'un export et retraitement des données,
pourra vous fournir les fonctionnalités suivantes:
interrogation du catalogue via les champs les plus importants
possibilités d'exploitation d'opérateurs booléens, et/ou de proximité
recherche de mots ou de chaînes
(parfois, et si on bricole) "navigation" à travers des index d'auteurs, de mots clés, de codes de classification
quelques fonctions "rebonds" à partir de morceaux de notice
(parfois) gestion des "documents liés" (s'il y en a)
3
http://www.koha-fr.org/
4
http://www.pizz.net/
5
http://www-mathdoc.ujf-grenoble.fr/lgd/lgd.html
6
Wide Area Information Server (http://ls6-www.informatik.uni-dortmund.de/ir/projects/freeWAIS-sf/)
7
Global Implicit Search Engine (http://webglimpse.org/
8
Simple Web Indexing for Humans (http://sunsite.Berkeley.EDU/SWISH-E/
9
http://www.mysql.com/
10
http://www.hughes.com.au/products/msql/
11
http://www.fr.postgresql.org/
6
7
elle ne pourra pas proposer celles_ci:
accès "intégré" à des ressources extérieurs depuis une notice du catalogue
informations sur le prêt et la disponibilité d'un ouvrage
gestion personnalisée des lecteurs
profils de recherche personnalisés, services d'alertes.
etc…
Il appartient donc à chaque bibliothèque de mesurer en fonction essentiellement du budget dont elle dispose, de
son cahier des charges et des besoins de ses lecteurs, d'effectuer un choix entre ses deux alternatives, sans perdre
de vue la perspective "multibases" qui sera traitée dans la deuxième partie du cours.
Voir icon more
Alternate Text