site search by freefind

follow me


Voser 1995 - Datenaustausch zwischen Geo- Informationssystemen - Abbildung zwischen zwei Datenmodellen auf konzeptioneller und logischer Ebene german/deutsch
Voser, Stefan A. 1995
Datenaustausch zwischen Geo- Informationssystemen - Abbildung zwischen zwei Datenmodellen auf konzeptioneller und logischer Ebene
3. deutsche Arc/Info-Anwender-Konferenz, März 1995, Freising.
Abstract
Raumbezogene Daten bilden die Basis von Geo- Informationssystemen. Diese müssen an die Bedürfnisse der jeweiligen Anwender angepaßt sein. Die Daten werden von unterschiedlichen Institutionen erfaßt. Als Folge davon werden die Daten in verschiedenen konzeptionellen und logischen Datenmodellen und GIS- Systemen verwaltet. Wenn Daten zwischen verschiedenen Institutionen ausgetauscht werden sollen, erfolgt dies auf organisatorischer, semantischer, systemtechnischer und physikalischer Ebene. Falls die Abbildungen auf diesen Ebenen nicht definiert sind, müssen Abbildungsvorschriften erstellt werden.
Ein wichtiger Schritt ist die Analyse der konzeptionellen räumlichen Modelle, in welchen die semantische Objektbildung vorgenommen wird. Die Schwierigkeit der Abbildung zwischen zwei Datenmodellen liegt darin, daß viele Objekte nicht eindeutig in das andere Modell abgebildet werden können, weil die Zielsetzungen der einzelnen GIS-Konzepte unterschiedliche Thematik und Detaillierungsgrade fordern, sowie weil sich die Strukturen der logischen Datenmodelle (hierarchisch objektorientiert oder nach dem Ebenen-Prinzip) unterscheiden können.
Der Datenaustausch zwischen verschiedenen GIS- Programmpaketen ist nicht befriedigend gelöst. Als Beispiel werden Probleme der Transformation von Geo- Daten aus ARC/INFO von ESRI nach MGDYNAMO von Intergraph diskutiert. Ein Lösungsweg wird aufgezeigt.
1. Gemeinsame Nutzung geographischer Informationen
Das Bedürfnis, raumbezogene Daten nicht nur selbst zu erfassen, sondern auch von Institutionen zu übernehmen, ist groß, insbesondere da die Datenerfassung der grösste Aufwand darstellt und zudem an spezielle Infrastrukturen gebunden ist. Viele Ämter und Unternehmen erfassen und verwalten bereits große Datenbestände geographischer Informationen. Im Hinblick auf eine gemeinsame Nutzung geographischer Informationen müssen die zukünftigen Entwicklungen zu einer Standardisierung in deren Handhabung führen. Schwierigkeiten der gemeinsamen Nutzung liegen auf organisatorischer, rechtlicher, konzeptioneller und logischer Ebene. Neben der Frage nach den Urheberrechten an digitalen Geo-Daten sind auch die Rechtsgültigkeit von amtlichen Informationen, d. h. Haftungsfragen sowie die Aspekte des Datenschutzes zu definieren. 
Der gemeinsamen Nutzung geographischer Informationen haben Formalismen und Standards von allgemeiner Gültigkeit zu unterliegen. Insbesondere müssen die verwendeten Standards unabhängig von den systeminternen Datenstrukturen (objektbasiert oder relational) sein. Es genügt dabei nicht, sich auf die Transformation von Form, Lage, Nachbarschaftsbeziehungen und Attribute von Objekten zu beschränken. Metainformationen über die Herkunft, Datenmodell und Datenstruktur, die Datenqualität, die Fortführung und Verfügbarkeit,  Abfragemodelle und die Verwahrung der Daten sind ebenso zu transformieren. Alle genannten Informationen sind nach dem Entwurf für die europäische Norm "Geographic Information - Reference Model" (CEN/TC267a) Bestandteil des konzeptionellen Datenmodelles.
Zur Realisierung dieser hohen Anforderungen ist die interdisziplinäre Zusammenarbeit zwischen den verschiedenen Nutzern notwendig. Die konzeptionellen Modelle müssen aufeinander abgestimmt werden, damit eine gemeinsame Erfassung, Nutzung und Finanzierung der Daten realisiert werden kann.
2. Austausch geographischer Informationen
Die Transformation geographischer Informationen spielt sich auf konzeptioneller, logischer und physikalischer Ebene ab. Die physikalische Ebene bezieht sich auf das Medium zum Austausch von digitalen Daten. Die logische Transformation beinhaltet die Abbildung der Geo-Informationen über eine Datenschnittstelle von der Herkunfts- in die Ziel-Datenstruktur. Dabei werden die Objekte in geometrische Primitive zerlegt, codiert und in ein vom Empfänger lesbares Format abgebildet. Die Austauschformate (Tabelle 1) können charakterisiert werden als systemspezifische Formate, Transfer- standards und spezielle Applikationen wie z.B. der Austausch zwischen zwei Programmsystemen. Auf konzeptioneller Ebene erfolgt eine Transformation, wenn den Ursprungs- und Zieldaten unterschiedliche konzeptionelle Modelle zugrunde liegen.
Charakteristik der Austauschformate
systemspezifisches Format
Transferstandards
spezielle Applikationen
Beispiele
  • Export- Format 
  • ARC/INFO- ASCII- Format
  • Neutral-File-  Format
  • SICAD- SQD
  • (DXF)
  • ...
  • EDBS
  • Interlis
  • DIGEST
  • SDTS
  • EXPRESS
  • DXF
  • ...
  • anwenderspezifische  ASCII-Formate
Tabelle 1: Beispiele für Austauschformate
2.1 Abbildung zwischen konzeptionellen Modellen
Konzeptionelle Modelle beschreiben die Abstraktion der Realität, abgestimmt auf die Bedürfnisse der Anwender von Geo- Informationen entsprechend der formalen
Beschreibung von Geometrie und Thematik. Ein konzeptionelles Modell soll unabhängig von den logischen Datenstrukturen eine Implementierung in einem System definiert werden, deren Umsetzung jedoch erfolgt als Anwendungsschema in einer GIS-Software. Bei der Abstimmung der Abstraktion auf Nutzungsbedürfnisse treten Vereinfachungen und Klassenbildungen auf, die beim Vergleich mit konzeptionellen Modellen anderer Anwendungen sehr unterschiedliche Übereinstimmung aufweisen können. Differenzen können in der Geometrie und in der Thematik auftreten.
Geometrische Übereinstimmung
Zur Übereinstimmung in der Geometrie gehören ein einheitliches Referenzsystem, die Genauigkeit, die geometrische Auflösung und Mindestgrößen. Genauigkeit und geometrische Auflösung sind Teilaspekte von Qualitätsmerkmalen. Die Genauigkeit ist ein Maß dafür, wie gut die Lage von digitalen Objekten mit ihrer wahren Lage übereinstimmt. Zur geometrischen Auflösung gehören geometrische Erfassungskriterien wie Mindestgrößen für Objekte, die mathematische Beschreibung von Objekten wie z.B. Linie, Kreis, Spline, Klothoide sowie die Art der Stützpunktverteilung - Digitalisierung markanter Punkte oder äquidistante Punktverteilung - und der geometrische Generalisierungsgrad. 
Thematische Übereinstimmung 
Auf der thematischen Seite muß die Möglichkeit der gegenseitigen Zuordnung zwischen allen Objekten der einzelnen Modelle untersucht werden. Zu den Vergleichen gehören Objektdefinitionen mit Attributierung, der Objekttyp (Punkt, Linie, Fläche...), Objektbildungsregeln, Erfassungskriterien und Aspekte der Datenqualität. Beim Vergleich von Geo-Daten sind die Prioritäten und die zeitliche Realisierung der Objekterfassung, die einzelnen Erfassungsphasen, die Art und den Zyklus der Fortführung und die Qualitätskriterien zu berücksichtigen. Zu den Qualitätsmerkmalen gehören geometrische und attributive Genauigkeit, Vollständigkeit, Aktualität und Herkunft der Daten und die logische Konsistenz der Daten.  Die Schwierigkeit liegt in vielen Fällen in einer eindeutigen Zuordnung der einzelnen Objekte zwischen zwei Datenmodellen. Oft ist die Abbildung zwischen den Objektarten einzelner Datenmodelle nicht eindeutig und somit nicht einfach umkehrbar.
Modellvergleiche 
Die Wechselwirkungen zwischen Geometrie und Thematik sind in Abbildung 1 dargestellt. Entweder fallen die Ansprüche an die Geometrie der zu vergleichenden Modelle zusammen, oder nicht. Die Grenze ist schwer zu definieren und muß von Fall zu Fall ermittelt werden. Beim thematischen Vergleich können Objektarten zusammenfallen, eine unterschiedliche thematische Auflösung besitzen oder kein Pendant besitzen. Für eine gemeinsame Nutzung digitaler Geo-Daten sind unter Berücksichtigung der Datenqualität nur diejenigen Objektarten von Bedeutung, welchen Übereinstimmung in Geometrie und Thematik zugeschrieben wird.
Die Fallunterscheidungen beim Vergleich von Datenmodellen sind Abbildung 2 zu entnehmen. Modelle können identisch sein, Teilmengen bilden, einen verwendbaren Durchschnitt aufweisen oder disjunkt sein. Die Übereinstimmung von Objekten kann durch gleiche Definition von Objektarten oder durch Identifikation über Attribute gewährleistet sein. In andere Modelle abbildbare Objekte können bidirektional, nur in eine Richtung eindeutig abbildbar sein oder mehrere Objekte können einem Objekt zugewiesen werden. Auf der anderen Seite finden Objekte keine Zuordung, weil sie in einem Modell nicht definiert sind, oder weil sie auf mehrere Objekte abbildbar sind.
Abb.1: Die Wechselwirkungen zwischen Geometrie und Thematik beim Vergleich von Datenmodellen
graphic
2.2 Unterschiedliche Datenstrukturen
Die Umsetzung eines konzeptionellen Modelles ist an die Datenstrukturen der GIS-Software gebunden. Die Philosophien in der Datenverwaltung können wie folgt gruppiert werden, wobei Kombinationen davon nicht auszuschliessen sind:
  • Ebenen-Prinzip
  • relationale Datenverwaltung
  • hierarchisch objektorientiert
Die unterschiedliche Verwaltung von Geometrie und Sachdaten kann zur Erstellung aufwendiger Algorithmen bei der Abbildung von GeoDaten in ein anderes System führen. Die Geo-Objekte basieren auf den geometrischen Primitiven Punkt, Linie, Fläche, sowie auf Text und können zusätzlich komplexe Objekte komponieren. Die Transformation komlexer Objekte zwischen unterschiedlichen Datenstrukturen führt zu Problemen, die noch nicht gelöst sind.
Abb. 2: Fallunterscheidungen beim Vergleich von Datenmodellen
graphic
2.3 Transformation von Geometrie
Die Transformation der Geometrie von Objekten ist eine fundamentale Aufgabe bei der Abbildung zwischen Geo-Modellen. Die Objekte werden dabei in ihre geometrischen Primitiven Punkt und Linie, Fläche zerlegt. Die topologischen Informationen der geometrischen Primitiven werden von Knoten, Kanten und Maschen getragen.
Die unterschiedlichen Datenstrukturen erlauben geometrische Eigenschaften, welche nicht eineindeutig abbildbar sind. Dies ist insbesondere bei flächenhaften Objekten der Fall, indem sich z.B. Objekte derselben Klasse gegenseitig überlagern können. Ebenso kann die Transformation von Flächen mit Inseln zu Problemen führen.
Die Transformation von topologischen Informationen ist nicht in jedem Fall zwingend notwendig. Bei der Modellierung linienhafter Objekte und von Netzwerkstrukturen gehören diese Informationen zum Datenmodell. In vielen Fällen werden die topologischen Informationen für Konzistenztest benötigt und werden von System direkt erzeugt, wodurch eine Transformation dieser Informationen hinfällig werden kann.
2.4 Die Transformation von Sachdaten
Sachdaten sind objektspezifische Informationen. Diese attributiven Informationen sind bei einem Datenaustausch dem Objekt zuzuweisen. Eine Abbildung zwischen unterschiedlichen Datenstrukturen erfordert eine Umorganisation insbesordere der Sachdaten, da die Objekte zusammengefaßt und zerlegt werden können. Die Umorganisation benötigt u.a. Abbildungsmodelle zwischen relationalen und hierarchisch-objektbasierten Strukturen. Diese Abbildungsmodelle können zu unterschiedlichen Zeitpunkten der Datentransformation vorgenommen werden. Entweder erfolgt dies im Quell- oder Zielsystem direkt oder innerhalb des Schnittstellenprogramms. In Spezialfällen kann diese strukturelle Umwandlung auch auf die Transferfiles angewendet werden.
3. Die Transformation zwischen ARC/INFO und MGDYNAMO
Die nun folgenden Betrachtungen gelten der Transformation von Geo-Daten zwischen Arc/Info und MGDynamo von Intergraph. Hintergrund dazu ist die Fragestellung, inwieweit bestehende Daten in Arc/Info 6.1 in ein Datenmodell, das unter MGDynamo realisiert ist, transformiert werden können. Ein Schwerpunkt der Untersuchungen liegt darin, Geometrie und Attribute in MGDynamo einzulesen, da MGDynamo keine Funktion anbietet, ASCII-Dateien äquivalent zum Generate-Modul von Arc/Info ein- und auszugeben. Die Verwendung eines Transferstandards stand dabei vordergründig nicht zur Diskussion.
Es werden die Datenstrukturen von Arc/Info und MGDynamo in der Detailiertheit verglichen, wie sie zur Transformation von punkt-, linien- und flächenhaften Grundbausteinen notwendig ist. Das gewählte Verfahren zur Überführung von Geometrie und Sachdaten wird dargestellt.
3.1 Gegenüberstellung der Datenstrukturen von ARC/INFO und MGDYNAMO
In Arc/Info werden die Daten nach dem Ebenenprinzip in Coverages verwaltet. Diese Ebenen dienen in der Regel der Verwaltung einzelner Themen. Als Grundbausteine stehen verschiedene  Featureklassen zur Verfügung. In diesem Zusammenhang werden nur Punkt, Linien und Flächen betrachtet. Arc/Info baut auf Punkten (Labelpoints) und Linien (Arcs) auf. Flächen können aus topologisch geschlossenen Linien und einem Labelpunkt als Informationsträger gebildet werden. Die zugehörigen Objektinformationen werden für jede Ebene über Identifikatoren relational in Attributtabellen der Info-Datenbank oder in externen Datenbanken verwaltet. Jeder Ebene wird ein Satz von Attributtabellen zugewiesen. Für Punkte und Flächen (Labelpunkte) steht eine Attributtabelle zur Verfügung (.pat - point or polygon-attribute-table). Aus diesem Grund können in einer Ebene Punkte und Flächen nicht gleichzeitig verwaltet werden. Sind einer Thematik punkt-, linien- und flächenhafte Objekte zugeordnet, müssen somit mindestens zwei Coverages erstellt werden. In einer Coverage können keine sich überlagernde flächenhafte Objekte vorkommen. Die Informationen über Linien werden in den Arc-Attribute-Tables (.aat) gespeichert. In einer Coverage stehen noch weitere Grundbausteine mit den zugehörigen Attributtabellen zur Verfügung: Nodeattributtables (Node = Knoten), Tic-Attributtabelle mit Referenzierungspunkten, Text- Attributtabellen mit Subklassen sowie für linienhafte Objekte Route- und Section-Attribute-Tables ebenfalls mit Subklassen. Die physikalische Datenverwaltung erfolgt für einzelne Workspaces in einer Vielzahl von Dateien.
Die Datenstruktur von MGDynamo ist objektbasiert. Die Objekthierarchie besteht aus Thematik (Theme Class), zusammengesetzten Objektklassen (Composit Feature Class) und Grundbausteinen (Base Feature Class). Als Grundbausteine verwendet MGDynamo punkt-, linien und flächenhafte Objekte und gerichtete Linien. All diesen Modellbausteinen können Attribute zugeordnet werden. Flächen derselben Objektart können sich gegenseitig überlagern. Zwischen den einzelnen Bausteinen werden  Besitzer/Komponenten- Beziehungen definiert. Die Grundbausteine bilden die unterste Ebene der Objekthierarchie und sind Komponenten von zusammengesetzten Objekten oder Themen. Ein Grundbaustein kann mehrere Zugehörigkeiten zu zusammengesetzten Objekten und Themen besitzen (m:n-Relationen). Zusammengesetzte Objekte können Themen oder höhergestellten zusammengesetzten Objekten zugehören (m:n- Relationen). Die Themen sind dieoberste Hierarchiestufe und sind Besitzer von einfachen und zusammengesetzten Objektklassen. Die Daten eines Objectspaces werden in einem File verwaltet.
Für die Beschreibung von Linien und Flächenbegrenzung kennen Arc/Info und MGDynamo nur gerade Verbindungen zwischen Stützpunkten.
Abb. 3: Datenstrukturen in Arc/Info und MGDynamo
graphic
3.2 Der Datentransfer von ARC/INFO nach MGDYNAMO
Der Datentransfer erfolgt über ASCII-Dateien. Es wird der Weg von Arc/Info nach MGDynamo erläutert (Abbildung 4). Für die Ausgabe der Geometrie wird in Arc/Info das Arc-Modul Generate mit dem Befehl" ungenerate" verwendet. Das Ausschreiben von Attributen aus der Info-Datenbank kann mit den Befehlen" output" und" print" realisiert werden. MGDynamo bietet standardmässig keine entsprechende Möglichkeit an. Deshalb wurde mit der von MGDynamo unterstützten Parametric Programming Language (PPL) ein Programm entwickelt, welches punkt-, linien- und flächenhafte Objekte mit Attributen aus einem speziellen ASCII-Format in MGDynamo lädt. Das PPL-Programm und das ASCII- Format sind generell einsetzbar. Die Voraussetzung ist, daß das Datenschema bereits als Datadictionnary im Objektspace vorhanden ist.
Die ASCII-Transferfiles
Die in Arc/Info erzeugten ASCII-Files haben je nach Option (point, line, poly ...) unterschiedliche Spaghetti- Strukturen. In Punktdateien stehen Punkte in einer Zeile (ID, easting, northing) und das Dateiende wird durch ein END markiert. Liniendateien enthalten zu Beginn eines Objektes die eindeutige Identifikationsnummer (ID).
Die Koordinaten folgen zeilenweise (easting, northing) und das Objekt wird durch END abgeschlossen. Als Dateiende wird ein zusätzliches END verwendet. Die
Flächendateien basieren auf der Struktur für Linien. Eine Fläche beginnt mit der ID, welche durch den zugehörigen Labelpunkt represäntiert wird (ID, easting,
northing) und wird von Zeilen mit Koordinatenpaaren gefolgt, wobei die Koordinaten von Anfängs und Endpunkt identisch sind. Die Flächenumrandung wird durch ein END angeschlossen. Zusätzlich können einer Fläche direkt im Anschluss noch topologische Informationen folgen. Dies sind topologische Inseln, und nicht geschlossene Linien die mit der vorangegangenen Flache in Beziehung stehen. Eine entsprechende Geometrie beginnt mit '-99999' und wird  durch END begrenzt. Ist einer topologischen Fläche in Arc/Info kein Labelpunkt zugeordnet, so wird die Insel als Fläche mit der ID '0' ausgeschrieben. Auffallend ist, daß bei Flächen viele Stützpunkte doppelt ausgeschrieben werden.
Beim Ausschreiben der Attributtabellen aus der INFO-Datenbank (z.B. mit" output"," print") ist es sinnvoll, Items direkt bei Erzeugen der Ausgabedateien zu selektieren und in die gewünschte Reihenfolge zu bringen. So sind die Items, welche bei der Erzeugung der Topologie angelegt werden, für viele weiterführende Applikationen nicht notwendig. Bei der Ausgabe wird für jeden Record eine Zeile angelegt. Für eine Vereinigung von Geometrie und Attributen sollen pro Coverage und pro Featureclass separate Files erzeugt werden. Die Reihenfolge von Objekten ist in Geometrie- und Attributdateien in der Regel identisch. Dennoch sind die Dateien auf Unregelmäßigkeiten zu prüfen.  Das Zusammenfügen von Geometrie und Attributen kann unter UNIX mit Systembefehlen realisiert werden ("nawk"," sort" ...). Siehe z.B. [Garner 93]. Es sind Kontrollen über die Reihenfolge von IDs, mehrfaches Vorkommen von IDs sowie die genannten Sonderheiten bei Flächen zu beachten. Flächen mit ID '0' haben keine Attribute, Inseln ID '-99999' bedürfen einer speziellen Behandlung.  Das selbstdefinierte Zwischenformat verlangt für ein Objekt die Information, welchem Thema und welcher Objektart die Geometrie und die Attribute zuzuweisen sind. Für die Geometrie- und Sachdaten werden Identifikatoren in den Zeilen (COOR, ATTR) verwendet. Ein Objekt wird durch ENDS abgeschlossen. Der Realisierungsstand ist so, dass das Datenschema aus Themen mit zugehörigePunkt-, Linien- und Flächenobjekten bestehen kann.
Abb. 4: Datenfluß von Arc/Info nach MGDynamo
graphic
3.3 Ausblick
Eine gemeinsame Nutzung geographischer Informationen zwischen verschiedenen Institutionen ist anzustreben. Dies erfordert eine gemeinsame interdiszipinäre Erfassung, Fortführung, Nutzung und Finanzierung von Geo-Daten. Für eine gemeinsame Nutzung digitaler geographischer Informationen müssen noch viele Fragestellungen geklärt werden. Zur organisatorisch-rechtlichen Seite gehören dazu die Frage nach den Urheberrechten von digitalen Geo-Daten, deren Rechtsgültigkeit sowie die Frage nach der Haftung bei fehlerhaften, zur gemeinsamen Nutzung zur Verfügung gestellten Daten. Auf der technischen Seite sind die Realisierung von Standards für die Datenmodellierung, den Datenaustausch und die Abbildung zwischen Datenmodellen zu forcieren und in die Praxis umzusetzen.  Im weiteren ist ein Verfahren gezeigt worden, wie ein einfaches Datenmodell aus Arc/Info nach MGDynamo transformiert werden kann.
Referenzen
ARC/INFO Data Model, Concepts, & Key Terms - ARC/INFO User´s Guide; ESRI; Okt. 1991
MGE Dynamic Analyst (Dynamo) - User's Guide; Intergraph; Sept. 1992
CEN/TC267a: Geographic Information - Reference Model; working draft, Version 3; Comité Européen de Normalisation; Sept. 1994
Garner 93: Joel Garner (WICT); Translating ARC/INFO Data into MGE; January 6, 1993; Verteiler : Intergraph