An E-Librarian Service
Supporting Explorative Learning by a Description Logics Based
Semantic Retrieval Tool
Elektronisch veröffentlicht auf dem
Publikationsserver der Universität Potsdam:
[http://nbn-resolving.de/urn:nbn:de:kobv:517-opus-17452] Hasso-Plattner-Institut fur˜ Software- und Systemtechnik GmbH
an der Universit˜at Potsdam
zur Erlangung des akademischen Grades
\doctor rerum naturalium"
(Dr. rer. nat.)
am Fachgebiet Internet Technologien und Systeme
eingereicht an der
Mathematisch-Naturwissenschaftlichen Fakult˜at
der Universit˜at Potsdam
Serge Linckels
Potsdam, September 2007Gutachter:
Prof. Dr. Christoph Meinel, Hasso-Plattner-Institut (HPI)
Prof. Dr. Thomas Engel, University of Luxembourg
Prof. Dr.-Ing. Djamshid Tavangarian, University of Rostock
Prufungsk˜ ommission:
Prof. Dr. Felix Naumann, Hasso-Plattner-Institut (HPI), Vorsitzender
Prof. Jean-Claude Asselborn, University of Luxembourg
Prof. Dr. Dr. hc. Klaus Denecke, University of Potsdam
Prof. Dr. Andreas Polze, (HPI)
Prof. Dr. Torsten Schaub, University of Potsdam
Prof. Dr. Andreas Schwill, University of P
Prof. Dr. Mathias Weske, Hasso-Plattner-Institut (HPI)
Datum der Disputation: 31.03.2008, Bewertung: summa cum laude.
ObwohlsichdieVerfugbark˜ eitvonp˜adagogischenInhalteninelektronischerFormstetigerh˜oht,
ist deren Nutzen in einem schulischen Umfeld recht gering. Die Hauptursache dessen ist, dass es zu
vieleunzuverl˜assige,redundanteundnichtrelevanteInformationengibt. DasFindenvonpassenden
Lernobjekten ist eine schwierige Aufgabe, die vom benutzerbasierten Filtern der passenden Infor-
mationen abh˜angig ist. Damit Wissensbanken wie das online Tele-TASK Archiv zu nutzlic˜ hen,
p˜adagogischen Ressourcen werden, mussen˜ Lernobjekte korrekt, zuverl˜assig und in maschinen-
verst˜andlicher Form identiflziert werden, sowie e–ziente Suchwerkzeuge entwickelt werden.
Unser Ziel ist es, einen E-Bibliothekar-Dienst zu schafien, der multimediale Ressourcen in einer
Wissensbank auf e–zientere Art und Weise flndet als mittels Navigieren durch ein Inhaltsverzeich-
nis oder mithilfe einer einfachen Stichwortsuche. Unsere Pr˜amisse ist, dass passendere Ergebnisse
gefunden werden k˜onnten, wenn die semantische Suchmaschine den Sinn der Benutzeranfrage ver-
stehenwurde.˜ IndiesemFallw˜arendiegeliefertenAntwortenlogischeKonsequenzeneinerInferenz
und nicht die einer Schlusselw˜ ortsuche.
Tests haben gezeigt, dass unser E-Bibliothekar-Dienst unter allen Dokumenten in einer gegebe-
nen Wissensbank diejenigen flndet, die semantisch am besten zur Anfrage des Benutzers passen.
Dabei gilt, dass der Benutzer eine vollst˜andige und pr˜azise Antwort erwartet, die keine oder nur
wenige Zusatzinformationen enth˜alt. Au…erdem ist unser System in der Lage, dem Benutzer
die Qualit˜at und Pertinenz der gelieferten Antworten zu quantiflzieren und zu veranschaulichen.
Schlussendlich liefert unser E-Bibliothekar-Dienst dem Benutzer immer eine Antwort, selbst wenn
das System feststellt, dass es keine vollst˜andige Antwort auf die Frage gibt.
Unser E-Bibliothekar-Dienst erm˜oglicht es dem Benutzer, seine Fragen in einer sehr einfachen
und menschlichen Art und Weise auszudruc˜ ken, n˜amlich in naturlic˜ her Sprache. Linguistische
Informationen und ein gegebener Kontext in Form einer Ontologie werden fur˜ die semantische
˜Ubersetzung der Benutzereingabe in eine logische Form benutzt.
umgesetzt. In zwei Experimenten wurde in einem p˜adagogischen Umfeld die Angemessenheit und
die Zuverl˜assigkeit dieser Werkzeuge als Komplement zum klassischen Unterricht gepruft.˜ Die
Hauptergebnisse sind folgende: Erstens wurde festgestellt, dass Schuler˜ generell akzeptieren, ganze
Fragen einzugeben - anstelle von Stichw˜ortern - wenn dies ihnen hilft, bessere Suchresultate zu er-
halten. Zweitens, das wichtigste Resultat aus den Experimenten ist die Erkenntnis, dass Schulere-
sultate verbessert werden k˜onnen, wenn Schuler˜ unseren E-Bibliothekar-Dienst verwenden. Wir
haben eine generelle Verbesserung von 5% der Schulresultate gemessen. 50% der Schuler˜ haben
ihre Schulnoten verbessert, 41% von ihnen sogar ma…geblich. Einer der Hauptgrunde˜ fur˜ diese
positiven Resultate ist, dass die Schuler˜ motivierter waren und folglich bereit waren, mehr Einsatz
und Flei… in das Lernen und in das Erwerben von neuem Wissen zu investieren.
tionalenvironmentispoor, mainlyduetothefactthatthereistoomuchof(unreliable)redundant,
and not relevant information. Finding appropriate answers is a rather di–cult task being reliant
on the user flltering of the pertinent information from the noise. Turning knowledge bases like the
\machine-understandable" information, as well as developing simple but e–cient search tools with
the ability to reason over this information.
Our vision is to create an E-Librarian Service, which is able to retrieve multimedia resources
from a knowledge base in a more e–cient way than by browsing through an index, or by using a
simple keyword search. In our E-Librarian Service, the user can enter his question in a very simple
and human way; in natural language (NL). Our premise is that more pertinent results would be
retrievedifthesearchengine understoodthesenseoftheuser’squery. Thereturnedarethen
logical consequences of an inference rather than of keyword matchings. Our E-Librarian Service
does not return the answer to the user’s question, but it retrieves the most pertinent document(s),
in which the user flnds the answer to his/her question.
Among all the documents that have some common information with the user query, our E-
Librarian Service identifles the most pertinent match(es), keeping in mind that the user expects
an exhaustive answer while preferring a concise answer with only little or no information overhead.
Also, our E-Librarian Service always proposes a solution to the user, even if the system concludes
that there is no exhaustive answer.
Our E-Librarian Service was implemented prototypically in three difierent educational tools.
A flrst prototype is CHESt (Computer History Expert System); it has a knowledge base with 300
multimedia clips that cover the main events in computer history. A second prototype is MatES
in mathematics for secondary school w.r.t. the o–cial school programme. All clips were recorded
mainly by pupils. The third and most advanced prototype is the \Lecture Butler’s E-Librarain
Service"; it has a Web service interface to respect a service oriented architecture (SOA), and was
developed in the context of the Web-University project at the Hasso-Plattner-Institute (HPI).
in Luxembourg | were made to test the pertinence and reliability of our E-Librarian Service as
a complement to traditional courses. The flrst experiment (in 2005) was made with CHESt in
difierent classes, and covered a single lesson. The second experiment (in 2006) covered a period of
6 weeks of intensive use of MatES in one class. There was no classical mathematics lesson where
the teacher gave explanations, but the students had to learn in an autonomous and exploratory
way. They had to ask questions to the E-Librarian Service just the way they would if there was a
human teacher.
This thesis could not have been written without the support of lots of people. First of all, I
would like to thank my doctor-father Prof. Dr. Christoph Meinel | who gave me the opportunity
to start as an external Ph.D. student and always had an open door for me | for all the interesting
discussions and comments. A lot of ideas that I elaborated on this thesis originated from our
discussions. Prof. Meinel taught me a lot of things beyond computer science and turned the years
of my Ph.D. work into an amazing adventure.
I feel a deep sense of gratitude towards my wife Magali for providing technical help and advice,
and for continuously encouraging me in moments of stress and resignation.
I also want to express my gratitude to Prof. Dr. Djamshid Tavangarian, Prof. Dr. Thomas
Engel and Prof. Dr. Abraham Bernstein who have accepted to review this thesis, to Isabelle Wirth
for correcting my English errors in this document, and to Carole Dording who spent uncountable
hours on elaborating the knowledge base of MatES and on supervising the experiment in school.
This research project was supported by Luxembourg International Advanced Studies in Infor-
mation Technologies (LIASIT). Therefore, my special thanks goes to Prof. Dr. Th