Microsoft Office-Formate

Zusammenfassung der Problematiken:

  • MS-Excel verändert gern Daten wenn nicht sehr aufgepasst wird, da es nicht als Datenspeicher gedacht ist. Z.B. werden Zahlen ab und an als Datum erkannt und gehen beim umformatieren in eine Zahl verloren da nun die Sekunden seit 1900 des Datums eingetragen werden. Bei großen Datensätzen schwer zu finden.
  • Klassicher Import (Drag&Drop aus dem Browser, öffnen via Layer hinzufügen) von Excel-Tabellen nimmt Datenformate und die Überschriften nicht mit wenn z.B. nur Texte in der Tabelle sind. Zahlen mit Punkt-Trennung aus englisch orientierten Programmen sind z.B. auch Texte bei uns.
  • Der klassiche Import benötigt einen zweiten Schritt für die Darstellung von Geometrien (z.B. Erweiterung XY-Tools)
  • MS-Access (bzw. ESRI Personal-Geodatabase, da diese auf ACCESS basiert und daher mit den selben Einschränkungen versehen ist): Generell ohne Probleme in der Datenhaltung, aber unter Linux sehr aufwendig zum laufen zu bekommen (von iOS habe Ich keine Ahnung, ist aber sicher ähnlich). Unter Windows ist das alte Format einfach zu öffnen solange es sich um die 32-bit Version von QGIS handelt. Das neue (seit 2007) .accdb Format unter Windows ist auch vergleichsweise einfach zu öffnen via ODBC. Der benötigte Treiber (wenn kein Office mit ACCESS installiert ist) kann unproblematisch und ohne Anmeldung von Microsoft heruntergeladen werden.

QGIS-64bit ist ein Problem. Unter Windows kann der 64bit Access Treiber installiert werden und man kann die Datenbanken ohne Probleme öffnen. Aber nicht die Personal-File-Geodatabase, da die Logik der Geometrien nicht umgesetzt wird. Außerdem führt der 64bit Treiber wohl zu Problemen mit einem installierten 32bit Office.

Lösungsideen:

  1. Für den Import von Excel, DBF und ODS am besten das „Spreadsheet-Layers“ Plugin verwenden. Erlaubt Steuerung der zu importierenden Daten-Typen, Überschriften und Direktimport von x-y Daten.
  2. QGIS-32bit hat kein Importproblem mit Access, nur .accdb bedeutet etwas mehr Aufwand unter Windows (ODBC-Verbindung). Unter Linux ist der Import über die GDAL einer .mdb unproblematisch wenn die GDAL mit .mdb Support kompiliert wurde (Anleitung http://www.gdal.org/drv_mdb.html). Das neuere .accdb Format ist nur über einen ODBC Verbindung möglich, welche unter Linux schwierig einzurichten ist.
  3. Beim Anfordern von Daten generell Excel vermeiden, da ein Datenverlust bereits beim Export eingetreten sein kann. Es bestand im Stammtisch am Ende ein Konsens über die Reihenfolge der Verwendbarkeit der Formate.
    1. .csv Dateien: Wenn die Daten nicht allzu groß sind der minimal Konsens. Vermeidet proprietäres MS-Format und sollte frei sein von ungewollten Datenveränderungen. Allerdings muss die Kodierung (UTF8 vs. WIN-1252/ISO 8859-1) und Zeilenumbrüche im Auge behalten werden. Manchmal wird eine Tabelle als eine endlose Zeile interpretiert wenn diese in anderen Betriebssystemen erstellt wurde. (Zeilenumbrüche: \r\n in Windows vs \n in Linux vs \r in iOS).
    2. Access als .mdb: Kann auch direkt gelesen werden solange nicht QGIS-64bit oder Linux/iOS. Keine Datenveränderungen zu befürchten.
    3. Excel: wenn es eben nicht anders geht… Dann aber mit vordefinierten Spalten im Excel und besonderer Obacht bei den Export-Schnittstellen. Dokumentation wichtig.
    4. SQLite: Mein Favorit, aber eben unbekanntes Format für viele Nutzer und vor allem für die üblichen Export-Schnittstellen.