265
pages
Deutsch
Documents
2009
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
265
pages
Deutsch
Documents
2009
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
Publié par
Publié le
01 janvier 2009
Langue
Deutsch
Poids de l'ouvrage
70 Mo
Publié par
Publié le
01 janvier 2009
Langue
Deutsch
Poids de l'ouvrage
70 Mo
FACHBEREICH INFORMATIK
Schriftenreihe Band 28
Oliver Rübel
Linking Automated Data Analysis
and Visualization with Applications
in Developmental Biology and
High-energy Physics
Der Dekan (Hrsg.) Bibliografische Information Der Deutschen Bibliothek
Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen
Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über
http://dnb.ddb.de abrufbar.
Bibliographic information published by Die Deutsche Bibliothek
Die Deutsche Bibliothek lists this publication in the Deutsche Nationalbibliografie;
detailed bibliographic data is available in the Internet at http://dnb.ddb.de.
Herausgeber: Fachbereich Informatik
Der Dekan
Postfach 3049
Technische Universität Kaiserslautern, Gebäude 48
D-67653 Kaiserslautern
Verlag: Technische Universität Kaiserslautern
Druck: T
ZBT – Abteilung Foto-Repro-Druck
D-386
© Fachbereich Informatik, Kaiserslautern 2009
Alle Rechte vorbehalten, auch das des auszugsweisen Nachdrucks, der auszugsweisen oder vollständigen
Wiedergabe (Photographie, Mikroskopie), der Speicherung in Datenverarbeitungsanlagen und das der
Übersetzung.
Als Manuskript gedruckt. Printed in Germany.
ISSN 1610-2673
ISBN 978-3-941438-35-4Linking Automated Data Analysis and Visualization
with Applications in Developmental Biology and
High-energy Physics
Vom Fachbereich Informatik der Technischen Universitat¨
Kaiserslautern zur Erlangung des akademischen Grades Doktor
der Naturwissenschaften (Dr. rer. nat.) genehmigte
Dissertation von
Oliver Rubel.¨
Promotionskommission
Vorsitzender Prof. Dr. Karsten Berns
1. Gutachter Prof. Dr. Hans Hagen
2. Prof. Dr. Bernd Hamann
3. Gutachter Prof.Dr. Gunther H. Weber
Dekan Prof. Dr. Karsten Berns
Datum der wissenschaftlichen Aussprache 20. Nov 2009Abstract
Knowledge discovery from large and complex collections of today’s scientific datasets is a chal-
lenging task. With the ability to measure and simulate more processes at increasingly finer spa-
tial and temporal scales, the increasing number of data dimensions and data objects is presenting
tremendous challenges for data analysis and effective data exploration methods and tools. Re-
searchers are overwhelmed with data and standard tools are often insufficient to enable effective
data analysis and knowledge discovery.
The main objective of this thesis is to provide important new capabilities to accelerate sci-
entific knowledge discovery form large, complex, and multivariate scientific data. The research
covered in this thesis addresses these scientific challenges using a combination of scientific vi-
sualization, information visualization, automated data analysis, and other enabling technologies,
such as efficient data management. The effectiveness of the proposed analysis methods is demon-
strated via applications in two distinct scientific research fields, namely developmental biology
and high-energy physics.
Advances in microscopy, image analysis, and embryo registration enable for the first time
measurement of gene expression at cellular resolution for entire organisms. Analysis of high-
dimensional spatial gene e datasets is a challenging task. By integrating data clustering
and visualization, analysis of complex, time-varying, spatial gene expression patterns and their
formation becomes possible. The analysis framework MATLAB and the visualization have been
integrated, making advanced analysis tools accessible to biologist and enabling bioinformatic
researchers to directly integrate their analysis with the visualization.
Laser wakefield particle accelerators (LWFAs) promise to be a new compact source of high-
energy particles and radiation, with wide applications ranging from medicine to physics. To gain
insight into the complex physical processes of particle acceleration, physicists model LWFAs
computationally. The datasets produced by LWFA simulations are (i) extremely large, (ii) of
varying spatial and temporal resolution, (iii) heterogeneous, and (iv) high-dimensional, making
analysis and knowledge discovery from complex LWFA simulation data a challenging task. To
address these challenges this thesis describes the integration of the visualization system VisIt
and the state-of-the-art index/query system FastBit, enabling interactive visual exploration of ex-tremely large three-dimensional particle datasets. Researchers are especially interested in beams
of high-energy particles formed during the course of a simulation. This thesis describes novel
methods for automatic detection and analysis of particle beams enabling a more accurate and
efficient data analysis process. By integrating these automated analysis methods with visualiza-
tion, this research enables more accurate, efficient, and effective analysis of LWFA simulation
data than previously possible.Zusammenfassung
Die Analyse komplexer wissenschaftlicher Daten ist eine zentrale Herausforderung in der heuti-
gen Forschung. Komplizierte Vorgange¨ konnen¨ immer detaillierter gemessen und simuliert wer-
den. Dies fuhrt¨ dazu, dass aktuelle wissenschaftliche Datensatze¨ Informationen uber¨ immer mehr
Datendimensionen und Datenobjekte enthalten. Wissenschaftler werden uberw¨ altigt¨ mit Daten,
und herkommliche¨ Analyseverfahren sind oft nicht ausreichend um eine effektive Analyse der
vorhandenen Daten zu ermoglichen.¨
Das Hauptziel dieser Dissertation ist es, wichtige neue Methoden zu entwickeln um den ef-
fizienten Gewinn von Wissen von großen, komplexen, multivariaten wissenschaftlichen Daten
zu ermoglichen.¨ Um dieses Ziel zu erreichen, verwendet diese Arbeit eine Kombination aus Vi-
sualisierung, Datenanalyse, und anderen grundlegenden Technologien (zum Beispiel Verfahren
zum Management von großen Daten). Die Effektivitat¨ der vorgeschlagenen Methoden wird de-
monstriert anhand zweier unterschiedlicher Applikationen aus der Entwicklungsbiologie und der
Hochenergiephysik.
Fortschritte in der Mikroskopie, Bildanalyse, und Verfahren zur Registrierung von Embryo-
nen ermoglichen¨ zum ersten Mal die Messung von Genexpression mit zellularer¨ Auflosung¨
fur¨ vollstandige¨ Organismen. Raumliche¨ Genexpressionsdaten sind hochdimensional, wobei die
verschiedenen Gene durch komplexe Prozesse miteinander in Verbindung stehen. Die Analyse
dieser hochkomplexen Daten ist schwierig. Durch die Integration von Clustering und moder-
nen Visualisierungsverfahren ermoglicht¨ diese Forschungsarbeit die Analyse von komplexen,
raumlichen¨ und sich zeitlich verandernden¨ Genexpressionsmustern sowie deren Beziehungen
zueinander. Mittels der Integration von MATLAB, einem fortgeschrittenen System zur Daten-
analyse, mit der Visualisierung ermoglicht¨ diese Forschungsarbeit Biologen den Zugriff auf fort-
geschrittenen Analyseverfahren.
Plasmabasierte Kielfeld-Beschleuniger ermoglichen¨ die Erzeugung von hochenergetischen
Partikeln in sehr kurzer Distanz und versprechen in Zukunft die Moglichk¨ eit des Baus von
wesentlich kompakteren Partikelbeschleunigern, die Anwendung in der Medizin wie auch in
der Physik finden konnen.¨ Rechnergestutzte¨ Simulationen werden verwendet, um ein besseres
Verstandniss¨ der komplizierten physikalischen Vorgange¨ zu erlangen. Die resultierenden Simu-lationsdaten sind (i) extrem groß, (ii) haben unterschiedliche zeitliche und raumliche¨ Auflosung,¨
(iii) sind heterogen und (iv) hochdimensional. Die Analyse solcher hochkomplexen Daten ist
kompliziert. Durch die Integration des Visualisierungssystems VisIt mit dem Datenmanagement-
system FastBit ermoglicht¨ diese Forschungsarbeit die interaktive visuelle Analyse von extrem
großen dreidimensionalen Simulationsdaten. Im Rahmen der Datenanalyse sind hier insbeson-
dere charakteristische, hochenergetische Partikelbundel,¨ die wahrend¨ der Simulation geformt
werden, von Interesse. Um einen effizienten Datenanalyseprozess zu ermoglichen,¨ wurden im
Rahmen dieser Dissertation verschiedene Verfahren zur automatischen Detektion und Analy-
se von Partikelstrahlen entwickelt. Die Integration dieser Verfahren mit der Vi-
sualisierung ermoglicht¨ die genaue, effiziente, und effektive Analyse von Simulationsdaten von
Kielfeld-Beschleunigern.Acknowledgments
I want to use this opportunity to thank all people who made this work possible. First, I would
like to thank my advisors Bernd Hamann and Hans Hagen. Bernd and Hans gave me the oppor-
tunity to conduct my research at world-renowned research groups: (i) the International Research
Training Group “Visualization of Large and Unstructured Data Sets – Applications in Geospatial
Planning, Modeling, and Engineering” (IRTG 1131), University of Kaiserslautern, Germany;
(ii) the Institute for Data Analysis and Visualization (IDAV), University of California, Davis,
CA, USA; and (iii) the Visualization Group, Lawrence Berkeley National Laboratory (LBNL),
Berkeley, CA, USA. I would also like to thank E. Wes Bethel for his financial support, advice,
and guidance. Furthermore, I would like to thank Gunther H. Weber for his support, advice, and
help throughout my work.
During my time as a doctoral student I had the chance and honor to collaborate with many
outstanding scientist; m