Uni Göttingen
Institute for Informatics
Databases and Information Systems

dbis

Semistructured Data and XML
Summer 2006

Prof. Dr. Wolfgang May
Assistants: Erik Behrends, Oliver Fritzen

The course will be given in english in case that there are english-speaking students attending.
Date and Time: Wednesday 11-13 ct, Thursday 9-11 ct.
Lecture and Exercises/Lab mixed (see announcements on this page)
Rooms:
GOE: HS 1 (Math.Inst., Bunsenstrasse 3-5, 1.Stock, Südflügel)
CLZ: Multimediahörsaal (also nicht im CUTEC, sondern Tannenhöhe)

6 ECTS credits (Studies in Applied Informatics),

Diplom Wirtschaftsinformatik: 4 WiInf-credits, (elective/"Wahlbereich" Informatik).

The course is transmitted to TU Clausthal (ELAN project, taking place in the "Multimediahörsaal").
At Clausthal, contact Dietmar Sommerfeld for administrative issues.

Course Description

One of the most important facts that lead to the overall success of XML is that the "XML world" combines a lot of already known concepts in an optimal way for coping with a broad spectrum of requirements. The course will first review some of these preceding (partially even historic) concepts (network database model, relational databases, object-oriented databases) and the integration of data and metadata (SchemaSQL). Then, the idea of "semistructured data" is introduced by showing early representatives that helped to shape the XML world (F-Logic, OEM).

In the main part, XML is presented as a data model and a markup-meta-language, and the current languages of the concepts of the XML world are systematically investigated and applied: DTD, XPath, XQuery, XSLT, XLink, XML Schema, SQL/XML, RDF/OWL.

The lecture uses the geographical sample database "Mondial" in its XML version for illustrations.

For practical exercises, the XML software is installed in the IFI CIP Pool.

  • Students @GOE: IFI pool account application via the user interface at the assigned computers in the pool,
  • Students @CLZ: IFI pool account application via mail to Gunnar Krull.
The software playground page can be found here.

The recorded lectures can be found here.

Dates & Topics

  • All slides of the lecture: 2-on-1, 4-on-1 (except the introductory talk: 2-on-1, 4-on-1)).
    (slides can still change slightly - take the version that you printed once for learning)

Klausur: Mittwoch, 2.8.2006, 10-12h (90 Min.), MN 67 (CLZ: HS A Mathematik)

Hinweise zur Klausurvorbereitung

  • Konzepte verstehen und beschreiben können, und wissen, wann man sie wo anzuwenden hat; Vor- und Nachteile
  • "Programmieren" auf Papier mit XML, DTD, XPath, XQuery, sowie den XSLT-Grundkonstrukten; wichtigste XML Schema-Konstrukte
  • keine Syntaxdetails zu XML Schema - hier sollte bekannt sein, was man machen kann und wie man z.B. einen einfachen simple- oder complex-Type erstellt (oder z.B. eine Instanz zu einem vorgegebenen Typ validieren/angeben/korrigieren).
  • Grundideen zu DOM/SAX, XLink verstanden haben und anwenden können
  • "History"-Abschnitt: wissen, was die Knackpunkte der jeweiligen Konzepte waren, und wie sie zur Entwicklung beigetragen haben, bzw. was man davon prinzipiell in XML&friends wiederfindet.
  • Es können auch Aufgaben kommen, wo eine Text-Antwort erwartet wird: keine Romane mit zuvielen Details schreiben. Kurze, knappe Antwort, Aufzählung etc ...
  • Hier die Klausuren von 2004 und 2005 zum Durchrechnen:

Klausurergebnis

  • Klausurergebnis: [postscript, pdf]
    Bestanden ab 35 Punkten, danach in 5er-Schritten. 1.0 ab 80 Punkten.
  • Klausur mit Musterlösung
  • Klausur ohne Musterlösung
  • Klausureinsicht: einfach bei mir am Büro vorbeikommen und schauen ob ich da bin oder per Mail Termin ausmachen.
  • Wiederholungsprüfungen (ausschl. für Studierende, die in der regulären Klausur nicht bestanden haben oder krankgeschrieben waren):
    • Göttingen: am 17.10. und ggf. 19.10. mündlich (Anmeldefrist Munopag bis 30.9. wegen Festlegung von Einzelterminen).
    • Clausthal: Oktober oder November (ggf. Koordination mit Vorlesungsübertragung "Datenbanken").