Wie schon erwähnt, pflege ich eine umfangreiche Datenbank von Koordinatenpunkten (Flugplätzen, Außenlandefeldern, Landmarken, etc.) sowie eine Datenbank mit Lufträumen.

Die Datenbank beruht auf meinen eigenen Koordinaten-Sammlungen, die bis in die 80-ziger Jahre zurückreichen sowie auf Koordinaten aus vielen anderen erreichbaren Quellen. In jüngster Zeit habe ich mich oft abgestützt auf die Koordinaten, die vom Soaring Server von John Leibacher ladbar sind.

Z.Z. umfasst die Datenbank (heute 13.09.2019) knapp 72.000 eindeutige Koordinaten sowie ca. 149.000 Dubletten. Dubletten sind mit den eindeutigen Koordinaten-Datensätzen verlinkt. Damit kenne ich alle Synonyme und Derivate jedes Datums.

Die Zahl von top records war sogar schon mal größer. Aber die Erweiterung der Säuberungsalgorithmen hat jetzt viele Synonyme gefunden. Das sind gleiche Koordinatenpunkte jeweils anders benannt oder mit leicht unterschiedlichen Koordinaten. Alle diese Doppelgänger sind jetzt in die linked records gewandert.

Du wirst dich fragen, warum behält der scheele Horst die Dubletten (linked records). Das ist sofort einzusehen, wenn ich erkläre, wie ich mit den immer wieder neu zusammengestellten Koordinatensammlungen z.B. bei John Leibacher umgehe.

Auf dem Soaring Server und an anderen Stellen im Internet erscheinen immerwährend neue oder verbesserte Sammlungen. In unregelmäßigen Abständen lade ich deshalb die als "neu" erkennbaren Sammlungen in meine Datenbank.

Du wirst weiter unten sehen, dass ich in der Datenpflege solchen Datensätzen, die ich überprüft habe, ein Qualitätsmerkmal beigebe (auf einer Skala von 0 [völlig unklare Qualität] - 6 [per Messtischblatt überprüft]. Datensätze, die bereits überprüft sind, möchte ich beim Laden von neuen Koordinatendatensammlungen natürlich nicht überschreiben oder verlieren.

Deshalb checkt der Lademechanismus in jeder neuen Sammlung, ob ich einen als neu ausgewiesenen Koordinatendatensätze schon in ähnlicher Form in der Datenbank habe. Er findet sogar heraus, ob ich exakt und genau die gleichen Daten schon einmal geladen habe, dann verwirft er den neuen Datensatz aus dem Ladevorgang komplett.

Sind die Daten leicht verschieden, dann nimmt das Ladeprogramm zunächst mal an, dass es sich lohnt, diesen neuen Datensatz mindestens als Dublette zu behalten.

Wenn die Qualität des alten besten Datensatzes in der Datenbank "schwach" ist, kann ein neuer Datensatz, wenn er aus verlässlicher Quelle kommt (was "verlässlich" ist, bleibt mein Produktgeheimnis wie der Scoring-Algorithmus der Schufa), sogar der neue beste Datensatz werden. Der alte beste Datensatz wird dann zur Dublette herabgestuft.

So sind mit der Zeit Bündel von Datensätzen entstanden (Datensätze und verlinkte Dubletten). Ein Beispiel : "Rax Talstation" gibt es in zur Zeit 17 Ausführungen.

Meine Koordinatensammlung ist nicht auf Deutschland oder Europa beschränkt. Da sind Koordinaten aus allen Erdteilen vereint.

 

Version 8 ---- Copyright © 2008 - 2020  Horst Rupp