Datenkataloge als Teil der Datenstrategie
Am 30. August 2023 hat das Bundeskabinett die neue Nationale Datenstrategie beschlossen, die gemeinsam vom Bundesministerium für Digitales und Verkehr (BMDV), vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) und vom Bundesministerium des Innern und für Heimat (BMI) vorgelegt wurde. Die Strategie mit dem Titel „Fortschritt durch Datennutzung – Strategie für mehr und bessere Daten für neue, effektive und zukunftsweisende Datennutzung“ setzt vor allem auf eine bessere Datenbereitstellung und damit -nutzung. Ideales Instrument dafür sind sogeannnten Datenkataloge. infas 360 hat sich mit Umsetzung der Corona Datenplattform für das BMWK (2020) und Destatis (2021) auf die Implementierung Open Source basierter Datenkataloge spezialisiert.
Die neue Datenstrategie
Die neue Datenstrategie ist Leitbild der künftigen Datenpolitik. Hierfür richtet die Bundesregierung den Fokus auf die Bereitstellung von mehr und besseren Daten und setzt auf eine neue Kultur der Datennutzung und des Datenteilens. Die Strategie soll daher auch zum gemeinschaftlichen Handeln auffordern. Der Bund adressiert damit alle gesellschaftlichen Bereiche – Zivilgesellschaft, Wirtschaft, Wissenschaft und öffentliche Hand. Der gemeinsame Einsatz für eine effektive und zukunftsweisende Datennutzung erschließt neue wirtschaftliche Potenziale und bildet die Grundlage für mehr Fortschritt.
Datenkataloge als ideales Instrument zur Datenbereitstellung und -nutzung
Ein Datenkatalog ist eine detaillierte Bestandsaufnahme aller Datenbestände in einer Organisation. Es unterstützt Data Scientisten genauso wie Fachfremden, schnell die am besten geeigneten Daten für jeden analytischen oder geschäftlichen Zweck zu finden.
Ein Datenkatalog umfasst in der Regel Funktionen zum Sammeln und kontinuierlichen Anreichern – oder zur Pflege –der Metadaten, die mit den einzelnen Datenbeständen verknüpft sind, um die korrekte Identifizierung, Bewertung und Nutzung des jeweiligen Datenbestands zu erleichtern. Der Katalog bietet außerdem Tools, die Benutzern Folgendes ermöglichen:
- Suche im Katalog
- Automatisierte Ermittlung potenziell relevanter Daten, nach denen jedoch nicht gezielt gesucht wurde
- Regelung der Verwendung der Daten in Übereinstimmung mit den branchenspezifischen oder staatlichen Vorschriften / Lizenzbestimmungen
- Direktes Anzeigen und downlaoden von Daten
Die Vorteile liegen dabei klar auf der Hand:
- Besseres Verständnis von Daten durch verbesserten Kontext
- Daten- und Informationstransparenz für alle Bereiche
- Steigerung der Datenverfügbarkeit und -qualität
- Bessere Analysen in kürzerer Zeit
- und somit Steigerung der organisatorischen bzw. betrieblichen Effizienz
Best Case Datenkatalog infas 360
Mit der neuen Datenstrategie stellt die infas 360 GmbH ihren neuen Datenkatalog als Best Case vor. Während der Pandemie wurde sich auf die hausinterne Umsetzung Open Source basierter Datenkataloge spezialisiert. Dazu bedarf es Datenbankprogrammierungen für das Backend – vor allem bei dynamischen Daten – und Oberflächendesign und -anpassungen im Frontend. Die eingesetzten Komponenten umfassen
- CKAN (Python|Flask)
- Apache Solr
- PostgreSQL
Im Ergebnis können Organisationen so ideal für Interne und/oder Externe ihre eigenen Daten auffindbar machen, beschreiben und sogar direkt zum downloaden bereitstellen. Fortgeschrittene Datenkataloge haben eine zusätzliche Nutzerverwaltung und unterscheiden nach Nutzergruppen mit verschiedenen Lizenzrechten. Hier geht’s zum Best Case.