In der externen Phase wird die Informationsstruktur des Datenmodells geplant. Dazu wird der Informationsbedarf der Benutzer ermittelt und strukturiert. Es muss herausgefunden werden, welche Informationen das Datenbanksystem liefern soll (Output) und welche Informationen dafür bereitzustellen sind (Input). Aus dieser Analyse ergibt sich die Informationsstruktur. Der Input bildet später die Datenbasis der Datenbank (z.B. Geschäftsobjekte wie Schüler und Klassen), der Output die zu erzielenden Ergebnisse, die Benutzersichten, z.B. in Form von Berichten und Formularen (Darstellungsobjekte wie Schülererfassungsmasken, Klassenlisten und Zeugnisse).
Zwei mögliche Ansätze
Top-Down-Ansatz (globales Datenmodell)
Die Informationsanforderungen aller späteren Datenbanknutzer (nicht die einzelne Anwendung) bestimmt die Informationsstruktur.
Beispiel: Alle für die Schule relevanten Objekte (Schüler, Lehrer, Klassen, Fächer, Eltern, Räume, Ausstattung usw.) werden erfasst. Es wird zunächst eine grobes Datenmodell entworfen und dann schrittweise verfeinert, so dass einzelne Anwendungen (Applikationen) entstehen.
Bottom-Up-Ansatz (anwendungsorientiertes Datenmodell)
Ein spezielles Problem ist Ausgangspunkt für die Datenbankentwicklung. Für die Lösung des Problems wird eine Anwendung entwickelt.
Beispiel: Um Zeit zu sparen, sollen die Zeugnisse und Schulbesuchsbescheinigungen über eine EDV-Anlage ausgefertigt werden. Die Integration der einzelnen Anwendungen kann zu einem globalen Datenmodell führen.
Ermittlung aufgrund von Realitätsbeobachtungen
Informationssysteme, z.B. zur Kontoführung bei Banken, Auskunftssystemen für Flugzeuge und Bahnen, Börsenauskunftssysteme, Lagerhaltungssysteme usw., speichern und verwalten Informationen über einen bestimmten Ausschnitt der realen Welt. Aber selbst solche Ausschnitte sind meist so komplex und vielgestaltig, dass sie nicht alle Einzelheiten beschreiben bzw. dass über den vielen Einzelheiten der Überblick über das Wesentliche verloren gehen kann. Deshalb ist oft bei der Beschreibung eine Beschränkung auf die wichtigsten oder interessantesten Objekte der Realität und ihre Beziehungen untereinander sinnvoll. Wir erzeugen dadurch einen Ausschnitt der realen Welt, eine Miniwelt.
Beispielsweise ist die Schule ein Teil der realen Welt. Unter dem Blickwinkel der Verwaltung von Schülerdaten würde unsere Miniwelt aus den Objekten Schüler, Lehrer, Bücher, Kurse, Noten und deren Beziehungen zueinander bestehen; andere Objekte der Schule, wie Gebäudedaten, Reinigungskosten usw. würden ausgeklammert. Wir bilden deshalb im Hinblick auf die logische Gesamtsicht ein Modell der Miniwelt.
Innerhalb des Modells können wir Fragen stellen, die im Modell beantwortet werden. Die Antworten sind aber durch das Modell begrenzt: So können wir keine Antwort darauf erhalten, wieso ein Schüler im Abitur gescheitert ist – hierzu haben wir weder Daten noch Methoden im Modell zur Verfügung. Wir müssen uns also immer bewusst sein, in welchem Bereich gültige Antworten zu erwarten sind und welche Bedeutung sie in der Wirklichkeit haben.
Innerhalb des Modells lassen sich Informationen sammeln, speichern und später wiedergewinnen bzw. durch Verknüpfung dieser Informationen neue Informationen finden, z.B. die Berechnung des Abiturdurchschnitts aus den Einzelnoten. Da unsere Informationen in einem Computersystem gespeichert werden, also zur Verarbeitung dienen, bezeichnet man sie auch als Daten. Die Daten sind Abbildungen des Modells der Miniwelt in den Speicher eines informationsverarbeitenden Systems.
Damit unser Modell ein möglichst getreues Abbild unserer Miniwelt darstellt, ist es vor allem notwendig, die realen Objekte und ihre Beziehungen zueinander möglichst exakt zu erfassen und zu beschreiben. Erst dann ist sichergestellt, dass das Modell nur solche Aussagen liefert, die wieder ihre Entsprechung in der Wirklichkeit haben. Wenn das Modell fehlerhaft ist, z.B. wegen fehlender oder falscher Daten oder falscher Struktur der Daten und ihrer Beziehungen, dann können nicht immer zuverlässige Aussagen über die reale Welt gemacht werden.
Betrachtet man die Miniwelt Schule, erkennt man gewisse Objekte und Objektmengen wie das Fach Französisch, eine Schülerin namens Manuela Musterfrau, einen Schulleiter namens Direx, einen Klassenleiter namens Huber, eine Schule mit dem Namen Winfriedschule in Fulda. Für den Begriff Objekt wird auch der Begriff Entität oder Instanz verwendet; entsprechend für Objektmenge der Begriff Entitätsmenge.
Um das Beispiel nicht zu komplex zu gestalten, soll hier eine Beschränkung auf die Objektmengen Schüler, Lehrer und Klassen vorgenommen werden. Zwischen diesen Objekten bestehen Beziehungen, die bestimmte Abläufe (Prozesse) oder Abhängigkeiten in der Miniwelt darstellen. Die Unterrichtsbelegung stellt die Beziehung zwischen einem Lehrer und den von ihm unterrichteten Klassen dar.
Um zum Datenmodell zu gelangen, stellt man Objekte und Beziehungen mit gleichartigen Attributen zu Typen zusammen. Somit ergeben sich für das gewählte Beispiel
- die Objektmengen Schüler, Lehrer und Klassen
- der Beziehungstyp unterrichtet
- Alle Lehrer bilden die Objektmenge Lehrer, alle Klassen die Objektmenge Klasse und alle Unterrichtsbelegungen die Beziehungsmenge unterrichtet.
- Jeder Objekt- und Beziehungstyp definiert bestimmte Eigenschaften (Merkmale, Attribute). Die Attribute des Objekttyps Lehrer sind: Lehrernummer, Nachname, Vorname, Amtsbezeichnung, Fächerkombination.
- Für den Objekttyp Klasse lassen sich z.B. folgende Eigenschaften feststellen: Klassenbezeichnung, Ausbildungsrichtung, Klassenleiter (LNr), Klassensprecher (SNr).
- Dem Beziehungstyp unterrichtet lassen sich z.B. die Merkmale LNr, Klassenbez, Fach zuordnen.
Hinweis: Die Begriffe Entität und Entitätsmenge werden häufig synonym verwendet.
Ermittlung aufgrund von Benutzersichtanalysen
Die Benutzersicht ist die Sicht, aus der der einzelne Benutzer die Daten sieht. Benutzersichten stellen zum Beispiel Formulare und Berichte dar. Bei der Benutzersichtanalyse können z.B. die Klassenlisten, Lehrerlisten und Zeugnisausdrucke als Grundlage für die Datenanalyse herangezogen werden. So kann aus dem Zeugnis oder einer Klassenliste die Informationsstruktur abgeleitet werden. Mit Hilfe dieses Verfahrens lässt sich ein Grobmodell verfeinern und ein detailliertes, anwendungsorientiertes Datenmodell erstellen.
Als Ausgangspunkt für eine solche Analyse kann z.B. ein Zeugnisformular einer Schule dienen. Aus diesem Formular lassen sich – genau wie bei der oben beschriebenen Analyse durch Realitätsbeobachtung – Objekte, Beziehungen zwischen diesen Objekten und Eigenschaften der Objekte abstrahieren.
Ermittlung aufgrund von Datenbestandsanalysen
Dieses Verfahren ermöglicht die Integration existierender Datenbestände in ein neues Datenmodell. Beispielsweise soll in der Schule von der Dateiorganisation zur Datenbankorganisation übergegangen werden. Der Übergang von einem System auf ein anderes wird als Migration bezeichnet.
Geschäftsregeln
Um die jeweilige Miniwelt genauer zu beschreiben, ist über die Angabe der Objekte (Entities) und ihrer Beziehungen zueinander hilfreich, so genannte Geschäftsregeln festzuhalten. Sie sind letztlich nichts anderes als Feststellungen über die Objekte der Miniwelt:
- Ein Zeugnis geht genau an eine(n) Schüler(in) und existiert ohne diesen nicht. Ein(e) Schüler(in) kann im Laufe der Oberstufe mehrere Zeugnisse erhalten; es gibt auch Schüler(innen), die noch kein Zeugnis erhalten haben, z.B. in der Jahrgangsstufe 11-I oder als Neuzugang.
- Ein Zeugnis enthält mindestens eine Kursangabe mit Note und Angaben über Fehlstunden und eventuell Bemerkungen; ohne Zeugnis sind diese Angaben sinnlos.
- Eine Kursangabe bzw. Fehlstunden und Bemerkungen können in vielen Zeugnissen auftauchen; es gibt Bemerkungen, die auf keinem Zeugnis stehen.
Das Modell einer Miniwelt entspricht um so besser der Realität, je genauer die Geschäftsregeln festgelegt sind. Beim Aufbau eines Datenbanksystems wird dadurch u.a. die Datenintegrität sichergestellt. Es ist dabei von Bedeutung, ob ein Objekt, z.B. ein Zeugnis, ohne ein anderes Objekt, z.B. eine Schülerin, existieren kann oder nicht.