|
Publications
>
Voser 1995 - Datenaustausch zwischen Geo- Informationssystemen - Abbildung zwischen zwei Datenmodellen auf konzeptioneller und logischer Ebene
|
back
next
|
|
|
|
Voser, Stefan A. 1995
Datenaustausch zwischen Geo- Informationssystemen
- Abbildung
zwischen zwei Datenmodellen auf konzeptioneller und logischer Ebene
3. deutsche Arc/Info-Anwender-Konferenz, März 1995, Freising.
Abstract
Raumbezogene Daten bilden die Basis von Geo- Informationssystemen. Diese
müssen an die
Bedürfnisse der jeweiligen Anwender angepaßt sein. Die Daten werden von unterschiedlichen
Institutionen erfaßt. Als Folge davon werden die Daten in verschiedenen konzeptionellen und
logischen Datenmodellen und GIS- Systemen verwaltet. Wenn Daten zwischen verschiedenen
Institutionen ausgetauscht werden sollen, erfolgt dies auf organisatorischer, semantischer,
systemtechnischer und physikalischer Ebene. Falls die Abbildungen auf diesen Ebenen nicht
definiert sind, müssen Abbildungsvorschriften erstellt werden.
Ein wichtiger Schritt ist die Analyse der konzeptionellen räumlichen
Modelle, in welchen die
semantische Objektbildung vorgenommen wird. Die Schwierigkeit der Abbildung zwischen zwei
Datenmodellen liegt darin, daß viele Objekte nicht eindeutig in das andere Modell abgebildet
werden können, weil die Zielsetzungen der einzelnen GIS-Konzepte unterschiedliche Thematik und
Detaillierungsgrade fordern, sowie weil sich die Strukturen der logischen Datenmodelle
(hierarchisch objektorientiert oder nach dem Ebenen-Prinzip) unterscheiden können.
Der Datenaustausch zwischen verschiedenen GIS- Programmpaketen ist nicht
befriedigend gelöst.
Als Beispiel werden Probleme der Transformation von Geo- Daten aus ARC/INFO von ESRI nach
MGDYNAMO von Intergraph diskutiert. Ein Lösungsweg wird aufgezeigt.
|
|
Das Bedürfnis, raumbezogene Daten nicht nur selbst zu erfassen, sondern auch von Institutionen
zu übernehmen, ist groß, insbesondere da die Datenerfassung der grösste Aufwand darstellt und
zudem an spezielle Infrastrukturen gebunden ist. Viele Ämter und Unternehmen erfassen und
verwalten bereits große Datenbestände geographischer Informationen. Im Hinblick auf eine
gemeinsame Nutzung geographischer Informationen müssen die zukünftigen Entwicklungen zu
einer Standardisierung in deren Handhabung führen. Schwierigkeiten der gemeinsamen Nutzung
liegen auf organisatorischer, rechtlicher, konzeptioneller und logischer Ebene. Neben der Frage
nach den Urheberrechten an digitalen Geo-Daten sind auch die Rechtsgültigkeit von amtlichen
Informationen, d. h. Haftungsfragen sowie die Aspekte des Datenschutzes zu definieren.
Der gemeinsamen Nutzung geographischer Informationen haben Formalismen und Standards
von
allgemeiner Gültigkeit zu unterliegen. Insbesondere müssen die verwendeten Standards
unabhängig von den systeminternen Datenstrukturen (objektbasiert oder relational) sein. Es genügt
dabei nicht, sich auf die Transformation von Form, Lage, Nachbarschaftsbeziehungen und Attribute
von Objekten zu beschränken. Metainformationen über die Herkunft, Datenmodell und
Datenstruktur, die Datenqualität, die Fortführung und Verfügbarkeit, Abfragemodelle und die
Verwahrung der Daten sind ebenso zu transformieren. Alle genannten Informationen sind nach dem
Entwurf für die europäische Norm "Geographic Information - Reference Model" (CEN/TC267a)
Bestandteil des konzeptionellen Datenmodelles.
Zur Realisierung dieser hohen Anforderungen ist die interdisziplinäre Zusammenarbeit
zwischen
den verschiedenen Nutzern notwendig. Die konzeptionellen Modelle müssen aufeinander
abgestimmt werden, damit eine gemeinsame Erfassung, Nutzung und Finanzierung der Daten
realisiert werden kann.
|
|
Die Transformation geographischer Informationen spielt sich auf konzeptioneller, logischer
und
physikalischer Ebene ab. Die physikalische Ebene bezieht sich auf das Medium zum Austausch
von digitalen Daten. Die logische Transformation beinhaltet die Abbildung der Geo-Informationen
über eine Datenschnittstelle von der Herkunfts- in die Ziel-Datenstruktur. Dabei werden die Objekte
in geometrische Primitive zerlegt, codiert und in ein vom Empfänger lesbares Format abgebildet.
Die Austauschformate (Tabelle 1) können charakterisiert werden als systemspezifische Formate,
Transfer- standards und spezielle Applikationen wie z.B. der Austausch zwischen zwei
Programmsystemen. Auf konzeptioneller Ebene erfolgt eine Transformation, wenn den Ursprungs-
und Zieldaten unterschiedliche konzeptionelle Modelle zugrunde liegen.
Charakteristik
der
Austauschformate
|
systemspezifisches Format
|
Transferstandards
|
spezielle
Applikationen
|
Beispiele
|
- Export-
Format
- ARC/INFO-
ASCII- Format
- Neutral-File-
Format
- SICAD- SQD
- (DXF)
- ...
|
- EDBS
- Interlis
- DIGEST
- SDTS
- EXPRESS
- DXF
- ...
|
- anwenderspezifische
ASCII-Formate
|
Tabelle 1: Beispiele für Austauschformate
|
|
Konzeptionelle Modelle beschreiben die Abstraktion der Realität, abgestimmt auf die
Bedürfnisse
der Anwender von Geo- Informationen entsprechend der formalen
Beschreibung von Geometrie und Thematik. Ein konzeptionelles Modell soll unabhängig
von den
logischen Datenstrukturen eine Implementierung in einem System definiert werden, deren
Umsetzung jedoch erfolgt als Anwendungsschema in einer GIS-Software. Bei der Abstimmung der
Abstraktion auf Nutzungsbedürfnisse treten Vereinfachungen und Klassenbildungen auf, die beim
Vergleich mit konzeptionellen Modellen anderer Anwendungen sehr unterschiedliche
Übereinstimmung aufweisen können. Differenzen können in der Geometrie und in der Thematik
auftreten.
Geometrische Übereinstimmung
Zur Übereinstimmung in der Geometrie gehören ein einheitliches Referenzsystem, die
Genauigkeit,
die geometrische Auflösung und Mindestgrößen. Genauigkeit und geometrische Auflösung sind
Teilaspekte von Qualitätsmerkmalen. Die Genauigkeit ist ein Maß dafür, wie gut die Lage von
digitalen Objekten mit ihrer wahren Lage übereinstimmt. Zur geometrischen Auflösung gehören
geometrische Erfassungskriterien wie Mindestgrößen für Objekte, die mathematische
Beschreibung von Objekten wie z.B. Linie, Kreis, Spline, Klothoide sowie die Art der
Stützpunktverteilung - Digitalisierung markanter Punkte oder äquidistante Punktverteilung - und der
geometrische Generalisierungsgrad.
Thematische Übereinstimmung
Auf der thematischen Seite muß die Möglichkeit der gegenseitigen Zuordnung zwischen
allen
Objekten der einzelnen Modelle untersucht werden. Zu den Vergleichen gehören Objektdefinitionen
mit Attributierung, der Objekttyp (Punkt, Linie, Fläche...), Objektbildungsregeln,
Erfassungskriterien und Aspekte der Datenqualität. Beim Vergleich von Geo-Daten sind die
Prioritäten und die zeitliche Realisierung der Objekterfassung, die einzelnen Erfassungsphasen, die
Art und den Zyklus der Fortführung und die Qualitätskriterien zu berücksichtigen. Zu den
Qualitätsmerkmalen gehören geometrische und attributive Genauigkeit, Vollständigkeit, Aktualität
und Herkunft der Daten und die logische Konsistenz der Daten. Die Schwierigkeit liegt in vielen
Fällen in einer eindeutigen Zuordnung der einzelnen Objekte zwischen zwei Datenmodellen. Oft ist
die Abbildung zwischen den Objektarten einzelner Datenmodelle nicht eindeutig und somit nicht
einfach umkehrbar.
Modellvergleiche
Die Wechselwirkungen zwischen Geometrie und Thematik sind in Abbildung 1 dargestellt.
Entweder fallen die Ansprüche an die Geometrie der zu vergleichenden Modelle zusammen, oder
nicht. Die Grenze ist schwer zu definieren und muß von Fall zu Fall ermittelt werden. Beim
thematischen Vergleich können Objektarten zusammenfallen, eine unterschiedliche thematische
Auflösung besitzen oder kein Pendant besitzen. Für eine gemeinsame Nutzung digitaler Geo-Daten
sind unter Berücksichtigung der Datenqualität nur diejenigen Objektarten von Bedeutung, welchen
Übereinstimmung in Geometrie und Thematik zugeschrieben wird.
Die Fallunterscheidungen beim Vergleich von Datenmodellen sind Abbildung 2 zu entnehmen.
Modelle können identisch sein, Teilmengen bilden, einen verwendbaren Durchschnitt aufweisen
oder disjunkt sein. Die Übereinstimmung von Objekten kann durch gleiche Definition von
Objektarten oder durch Identifikation über Attribute gewährleistet sein. In andere Modelle abbildbare
Objekte können bidirektional, nur in eine Richtung eindeutig abbildbar sein oder mehrere Objekte
können einem Objekt zugewiesen werden. Auf der anderen Seite finden Objekte keine Zuordung,
weil sie in einem Modell nicht definiert sind, oder weil sie auf mehrere Objekte abbildbar sind.
|
|
|
|
Die Umsetzung eines konzeptionellen Modelles ist an die Datenstrukturen der GIS-Software
gebunden. Die Philosophien in der Datenverwaltung können wie folgt gruppiert werden, wobei
Kombinationen davon nicht auszuschliessen sind:
- Ebenen-Prinzip
- relationale Datenverwaltung
- hierarchisch objektorientiert
Die unterschiedliche Verwaltung von Geometrie und Sachdaten kann zur Erstellung aufwendiger
Algorithmen bei der Abbildung von GeoDaten in ein anderes System führen. Die Geo-Objekte
basieren auf den geometrischen Primitiven Punkt, Linie, Fläche, sowie auf Text und können
zusätzlich komplexe Objekte komponieren. Die Transformation komlexer Objekte zwischen
unterschiedlichen Datenstrukturen führt zu Problemen, die noch nicht gelöst sind.
|
|
|
|
Die Transformation der Geometrie von Objekten ist eine fundamentale Aufgabe bei der
Abbildung
zwischen Geo-Modellen. Die Objekte werden dabei in ihre geometrischen Primitiven Punkt und
Linie, Fläche zerlegt. Die topologischen Informationen der geometrischen Primitiven werden von
Knoten, Kanten und Maschen getragen.
Die unterschiedlichen Datenstrukturen erlauben geometrische Eigenschaften, welche
nicht
eineindeutig abbildbar sind. Dies ist insbesondere bei flächenhaften Objekten der Fall, indem sich
z.B. Objekte derselben Klasse gegenseitig überlagern können. Ebenso kann die Transformation
von Flächen mit Inseln zu Problemen führen.
Die Transformation von topologischen Informationen ist nicht in jedem Fall zwingend
notwendig. Bei
der Modellierung linienhafter Objekte und von Netzwerkstrukturen gehören diese Informationen zum
Datenmodell. In vielen Fällen werden die topologischen Informationen für Konzistenztest benötigt
und werden von System direkt erzeugt, wodurch eine Transformation dieser Informationen hinfällig
werden kann.
|
|
Sachdaten sind objektspezifische Informationen. Diese attributiven Informationen sind
bei einem
Datenaustausch dem Objekt zuzuweisen. Eine Abbildung zwischen unterschiedlichen
Datenstrukturen erfordert eine Umorganisation insbesordere der Sachdaten, da die Objekte
zusammengefaßt und zerlegt werden können. Die Umorganisation benötigt u.a. Abbildungsmodelle
zwischen relationalen und hierarchisch-objektbasierten Strukturen. Diese Abbildungsmodelle
können zu unterschiedlichen Zeitpunkten der Datentransformation vorgenommen werden. Entweder
erfolgt dies im Quell- oder Zielsystem direkt oder innerhalb des Schnittstellenprogramms. In
Spezialfällen kann diese strukturelle Umwandlung auch auf die Transferfiles angewendet werden.
|
|
Die nun folgenden Betrachtungen gelten der Transformation von Geo-Daten zwischen Arc/Info
und
MGDynamo von Intergraph. Hintergrund dazu ist die Fragestellung, inwieweit bestehende Daten in
Arc/Info 6.1 in ein Datenmodell, das unter MGDynamo realisiert ist, transformiert werden können.
Ein Schwerpunkt der Untersuchungen liegt darin, Geometrie und Attribute in MGDynamo
einzulesen, da MGDynamo keine Funktion anbietet, ASCII-Dateien äquivalent zum Generate-Modul
von Arc/Info ein- und auszugeben. Die Verwendung eines Transferstandards stand dabei
vordergründig nicht zur Diskussion.
Es werden die Datenstrukturen von Arc/Info und MGDynamo in der Detailiertheit verglichen,
wie sie
zur Transformation von punkt-, linien- und flächenhaften Grundbausteinen notwendig ist. Das
gewählte Verfahren zur Überführung von Geometrie und Sachdaten wird dargestellt.
|
|
In Arc/Info werden die Daten nach dem Ebenenprinzip in Coverages verwaltet. Diese
Ebenen dienen
in der Regel der Verwaltung einzelner Themen. Als Grundbausteine stehen verschiedene
Featureklassen zur Verfügung. In diesem Zusammenhang werden nur Punkt, Linien und Flächen
betrachtet. Arc/Info baut auf Punkten (Labelpoints) und Linien (Arcs) auf. Flächen können aus
topologisch geschlossenen Linien und einem Labelpunkt als Informationsträger gebildet werden.
Die zugehörigen Objektinformationen werden für jede Ebene über Identifikatoren relational in
Attributtabellen der Info-Datenbank oder in externen Datenbanken verwaltet. Jeder Ebene wird ein
Satz von Attributtabellen zugewiesen. Für Punkte und Flächen (Labelpunkte) steht eine
Attributtabelle zur Verfügung (.pat - point or polygon-attribute-table). Aus diesem Grund können in
einer Ebene Punkte und Flächen nicht gleichzeitig verwaltet werden. Sind einer Thematik punkt-,
linien- und flächenhafte Objekte zugeordnet, müssen somit mindestens zwei Coverages erstellt
werden. In einer Coverage können keine sich überlagernde flächenhafte Objekte vorkommen. Die
Informationen über Linien werden in den Arc-Attribute-Tables (.aat) gespeichert. In einer Coverage
stehen noch weitere Grundbausteine mit den zugehörigen Attributtabellen zur Verfügung:
Nodeattributtables (Node = Knoten), Tic-Attributtabelle mit Referenzierungspunkten, Text-
Attributtabellen mit Subklassen sowie für linienhafte Objekte Route- und Section-Attribute-Tables
ebenfalls mit Subklassen. Die physikalische Datenverwaltung erfolgt für einzelne Workspaces in
einer Vielzahl von Dateien.
Die Datenstruktur von MGDynamo ist objektbasiert. Die Objekthierarchie besteht aus
Thematik
(Theme Class), zusammengesetzten Objektklassen (Composit Feature Class) und
Grundbausteinen (Base Feature Class). Als Grundbausteine verwendet MGDynamo punkt-, linien
und flächenhafte Objekte und gerichtete Linien. All diesen Modellbausteinen können Attribute
zugeordnet werden. Flächen derselben Objektart können sich gegenseitig überlagern. Zwischen
den einzelnen Bausteinen werden Besitzer/Komponenten- Beziehungen definiert. Die
Grundbausteine bilden die unterste Ebene der Objekthierarchie und sind Komponenten von
zusammengesetzten Objekten oder Themen. Ein Grundbaustein kann mehrere Zugehörigkeiten zu
zusammengesetzten Objekten und Themen besitzen (m:n-Relationen). Zusammengesetzte
Objekte können Themen oder höhergestellten zusammengesetzten Objekten zugehören (m:n-
Relationen). Die Themen sind dieoberste Hierarchiestufe und sind Besitzer von einfachen und
zusammengesetzten Objektklassen. Die Daten eines Objectspaces werden in einem File
verwaltet.
Für die Beschreibung von Linien und Flächenbegrenzung kennen Arc/Info und MGDynamo
nur
gerade Verbindungen zwischen Stützpunkten.
|
|
|
|
Der Datentransfer erfolgt über ASCII-Dateien. Es wird der Weg von Arc/Info nach MGDynamo
erläutert (Abbildung 4). Für die Ausgabe der Geometrie wird in Arc/Info das Arc-Modul Generate mit
dem Befehl" ungenerate" verwendet. Das Ausschreiben von Attributen aus der Info-Datenbank
kann
mit den Befehlen" output" und" print" realisiert werden. MGDynamo bietet standardmässig
keine
entsprechende Möglichkeit an. Deshalb wurde mit der von MGDynamo unterstützten Parametric
Programming Language (PPL) ein Programm entwickelt, welches punkt-, linien- und flächenhafte
Objekte mit Attributen aus einem speziellen ASCII-Format in MGDynamo lädt. Das PPL-Programm
und das ASCII- Format sind generell einsetzbar. Die Voraussetzung ist, daß das Datenschema
bereits als Datadictionnary im Objektspace vorhanden ist.
Die ASCII-Transferfiles
Die in Arc/Info erzeugten ASCII-Files haben je nach Option (point, line, poly ...)
unterschiedliche
Spaghetti- Strukturen. In Punktdateien stehen Punkte in einer Zeile (ID, easting, northing) und das
Dateiende wird durch ein END markiert. Liniendateien enthalten zu Beginn eines Objektes die
eindeutige Identifikationsnummer (ID).
Die Koordinaten folgen zeilenweise (easting, northing) und das Objekt wird durch END
abgeschlossen. Als Dateiende wird ein zusätzliches END verwendet. Die
Flächendateien basieren auf der Struktur für Linien. Eine Fläche beginnt mit der ID,
welche durch
den zugehörigen Labelpunkt represäntiert wird (ID, easting,
northing) und wird von Zeilen mit Koordinatenpaaren gefolgt, wobei die Koordinaten
von Anfängs
und Endpunkt identisch sind. Die Flächenumrandung wird durch ein END angeschlossen.
Zusätzlich können einer Fläche direkt im Anschluss noch topologische Informationen folgen. Dies
sind topologische Inseln, und nicht geschlossene Linien die mit der vorangegangenen Flache in
Beziehung stehen. Eine entsprechende Geometrie beginnt mit '-99999' und wird durch END
begrenzt. Ist einer topologischen Fläche in Arc/Info kein Labelpunkt zugeordnet, so wird die Insel
als Fläche mit der ID '0' ausgeschrieben. Auffallend ist, daß bei Flächen viele Stützpunkte doppelt
ausgeschrieben werden.
Beim Ausschreiben der Attributtabellen aus der INFO-Datenbank (z.B. mit" output","
print") ist es
sinnvoll, Items direkt bei Erzeugen der Ausgabedateien zu selektieren und in die gewünschte
Reihenfolge zu bringen. So sind die Items, welche bei der Erzeugung der Topologie angelegt
werden, für viele weiterführende Applikationen nicht notwendig. Bei der Ausgabe wird für jeden
Record eine Zeile angelegt. Für eine Vereinigung von Geometrie und Attributen sollen pro Coverage
und pro Featureclass separate Files erzeugt werden. Die Reihenfolge von Objekten ist in
Geometrie- und Attributdateien in der Regel identisch. Dennoch sind die Dateien auf
Unregelmäßigkeiten zu prüfen. Das Zusammenfügen von Geometrie und Attributen kann unter
UNIX mit Systembefehlen realisiert werden ("nawk"," sort" ...). Siehe z.B. [Garner
93]. Es sind
Kontrollen über die Reihenfolge von IDs, mehrfaches Vorkommen von IDs sowie die genannten
Sonderheiten bei Flächen zu beachten. Flächen mit ID '0' haben keine Attribute, Inseln ID '-99999'
bedürfen einer speziellen Behandlung. Das selbstdefinierte Zwischenformat verlangt für ein Objekt
die Information, welchem Thema und welcher Objektart die Geometrie und die Attribute zuzuweisen
sind. Für die Geometrie- und Sachdaten werden Identifikatoren in den Zeilen (COOR, ATTR)
verwendet. Ein Objekt wird durch ENDS abgeschlossen. Der Realisierungsstand ist so, dass das
Datenschema aus Themen mit zugehörigePunkt-, Linien- und Flächenobjekten bestehen kann.
|
|
|
|
Eine gemeinsame Nutzung geographischer Informationen zwischen verschiedenen Institutionen
ist
anzustreben. Dies erfordert eine gemeinsame interdiszipinäre Erfassung, Fortführung, Nutzung und
Finanzierung von Geo-Daten. Für eine gemeinsame Nutzung digitaler geographischer Informationen
müssen noch viele Fragestellungen geklärt werden. Zur organisatorisch-rechtlichen Seite gehören
dazu die Frage nach den Urheberrechten von digitalen Geo-Daten, deren Rechtsgültigkeit sowie die
Frage nach der Haftung bei fehlerhaften, zur gemeinsamen Nutzung zur Verfügung gestellten
Daten. Auf der technischen Seite sind die Realisierung von Standards für die Datenmodellierung,
den Datenaustausch und die Abbildung zwischen Datenmodellen zu forcieren und in die Praxis
umzusetzen. Im weiteren ist ein Verfahren gezeigt worden, wie ein einfaches Datenmodell aus
Arc/Info nach MGDynamo transformiert werden kann.
|
|
ARC/INFO Data Model, Concepts, & Key Terms - ARC/INFO User´s Guide; ESRI; Okt.
1991
MGE Dynamic Analyst (Dynamo) - User's Guide; Intergraph; Sept. 1992
CEN/TC267a: Geographic Information
- Reference Model; working draft, Version 3; Comité
Européen de Normalisation; Sept. 1994
Garner 93: Joel Garner (WICT); Translating
ARC/INFO Data into MGE; January 6, 1993; Verteiler :
Intergraph
|
|
|
|
|