Uni Göttingen
Institute for Informatics
Databases and Information Systems

dbis

Semistructured Data and XML
Summer 2011

Prof. Dr. Wolfgang May
Assistant: Daniel Schubert

Date and Time:

  • Thursday 14-16 ct, MN28 (Chemistry building [im EG der anorganischen Chemie, das ist der mittlere der drei Chemie-Türme]; derselbe HS, wo auch "Datenbanken" stattgefunden hat).
  • Friday 10-12 ct, HS2, A0.102, Physik "Max Born-Hörsaal".

Lecture and Exercises/Lab mixed (see announcements on this page)

Module CS.M.inf.320.
The module's home is the MSc studies in Applied CS. It can also be credited in the BSc studies in Applied CS, and in several other studies:
6 ECTS credits (Studies in Applied Informatics and in BSc Wirtschaftsinformatik),
Diplom Wirtschaftsinformatik: 4 WiInf-credits, (elective/"Wahlbereich" Informatik).
Maths (Dipl, MSc), Teaching, Magister, PhD GAUSS, ...

Note: the Modulkatalog/Studienordnung requires that participants have successfully attended the module "Databases".

Course Description

One of the most important facts that lead to the overall success of XML is that the "XML world" combines a lot of already known concepts in an optimal way for coping with a broad spectrum of requirements. The course will first review some of these preceding (partially even historic) concepts (network database model, relational databases, object-oriented databases) and the integration of data and metadata (SchemaSQL). Then, the idea of "semistructured data" is introduced by showing early representatives that helped to shape the XML world (F-Logic, OEM).

In the main part, XML is presented as a data model and a markup-meta-language, and the current languages of the concepts of the XML world are systematically investigated and applied: DTD, XPath, XQuery, XSLT, XLink, XML Schema, and SQL/XML.

The lecture uses the geographical sample database "Mondial" in its XML version for illustrations.

For practical exercises, the XML software is installed in the IFI CIP Pool. The software playground page can be found here.
The sample code fragments can be found in the pool under /afs/informatik.uni-goettingen.de/course/xml-lecture/ .

Dates & Topics

  • 14.4. keine Vorlesung (Chemie-HS nicht verfügbar).
  • 15.4. Administrativa, Overview, Introductory Presentation "XML".
    [Slides 2-on-1] [Slides 4-on-1]
  • 21.4.: General concepts and notions of the database area.
    Slides: Relational Model
  • 22.4. wieder nix. Karfreitag.
  • 28.4.: Earlier database models, concepts and extensions: Basic Concepts and Notions; example and recall: relational model. Slides: early DB concepts
  • 29.4.: Earlier database models, concepts and extensions: Network data model, Relational Model
  • Some references to read about database history (optionally):
  • 5.5.: "History" continued: Object-Oriented Model, Schema SQL, early semistructured data models.
    Slides: early semistructured data models
  • 6.5.: "History" continued: early semistructured data models.
  • 12.5.: "History" continued: early semistructured data models.
  • 13.5.: XML: data model, language, DTDs etc.
    Slides: XML basics
  • 19.5.: XML: data model, language, DTDs etc. (cont'd)
    Exercise sheet 1: XML & DTD
  • 20.5.: XML (cont'd)
  • 26.5.: XML (cont'd)
  • 27.5.: XPath: navigation and addressing language for XML
    Slides: XPath
    Exercise sheet 2: XPath
  • 2.6.: Feiertag
  • 3.6.: Discussion of Exercise sheet 1.
    Solution
  • 9.6.: XPath (cont'd)
  • 10.6. XML Query Languages: History - XQL
    Slides: XQuery
  • 16.6.: Discussion of Exercise Sheet 2
    Solution
  • 17.6. Discussion of Ex. 1.6; XQuery
    Exercise sheet 3: XQuery
  • 23.6. XQuery (Cont'd)
  • 24.6. XQuery (Cont'd)
  • 29.6. 14-16 SR 2.101 [Mittwoch -Termin des SQL-Praktikums] (freiwillig).
    SQL&XML: Der SQLX Standard in Oracle
    In dem Vortrag wird eine kurze Einführung in XML gegeben, und gezeigt, wie XML-Daten mit relationalen Daten kombiniert und innerhalb von SQL verarbeitet werden können.
    Folien: XML und SQLX.
  • 30.6. Updating XML Data (same slide set as XQuery);
    The transformation language: XSLT
    Slides: XSLT
    Exercise sheet 4: XSLT
  • 1.7. XSLT (Cont'd)
  • Ankündigung: Praktikum XML WS2011/12
  • Ankündigung: Seminar XML-based Markup Languages
  • 7.7. Besprechung Aufgabe 1.7 und Blatt 3;
    Lösung Blatt 3
    XSLT (Cont'd)
  • 8.7. Besprechung Blatt 4
    Lösung Blatt 4
  • Klausur: Donnerstag, 14.Juli, 14:00 s.t.-16:00, MN 28, Dauer 90 min.
  • 15.7. (optional): kurzer Überblick über die restlichen Dinge: XLink, XMLSchema, DOM, SAX, JAXB, ....

Klausur:

  • Klausurtermin: Donnerstag, 14.Juli, 14:00-16:00, MN28, Dauer 90 min.
  • Klausuranmeldung:
    • Wer sich per FlexNever anmelden kann, soll dies tun.
    • ausserdem bitte per Mail an may@informatik.uni-goettingen.de (Vorname, Nachname, Matrikelnummer, Studiengang)!
      Anmeldeschluss am 8.7., 23:59 Uhr
  • Hinweise, die auch in der letzten Vorlesung am 8.7. gegeben wurden:
    • Wenn etwas mit Datums/Zeitwerten drankommt (vgl. Aufgabe 3, Übungsblatt 4), darf eine einfache und intuitive Syntax analog zum Casting von Zahlwerten in XPath/XQuery verwendet werden, z.B. beginn > time('12:00') oder ende < date('2011-07-08')
    • Die Klausur wird wie üblich auf einem Szenario basieren. Dieses Szenario war ursprünglich für die Datenbank-SQL-Vorlesung im WS gedacht, hätte aber in SQL nicht gut bearbeitet werden können. Es profitiert wesentlich von Features, die man in XML ganz selbstverständlich benutzt.

Hinweise zur Klausurvorbereitung

Klausurergebnis

  • Klausurergebnis
    Notenspiegel
    Bestanden ab 36 Punkten, danach in 4er-Schritten. 1.0 ab 72 Punkten.
  • Klausur mit Musterlösung
  • Klausur ohne Musterlösung
  • Klausureinsicht: Freitag, 15.7. 12-12:30 Uhr (direkt nach der Vorlesung) in meinem Büro. Ansonsten nächste Woche ggf einfach vorbeikommen und schauen ob ich da bin (so etwa 10-12 und 13:30-16) oder per Mail Termin ausmachen.
  • Noten und Scheine:
    • Ergebnisse wurden an MatNatPA und WiwiPA weitergegeben; also erstmal abwarten, ob sie so freiwillig den Weg ins FlexNever finden.
    • Die Scheine (für alle, die bestanden haben) können bei Frau Jachinke (Mo-Fr 9-11, Raum 0.107) abgeholt werden.

Der ganze Foliensatz 1-auf-1.