SDC-Architektur jetzt auf Rucio/dCache basierend mit deutlich verbesserter Website.: Institut für Sonnenphysik

12 September 2023
Top, SDC

Das technologische Fundament des SDC basiert nun auf Rucio/dCache für die Datenverwaltung und -speicherung, und die Abfrage von Daten über das Web erfolgt nun über eine neue moderne Single-Page-Anwendung.

Das SDC war ursprünglich ein, auf einen Standort, nämlich das KIS in Freiburg, beschränktes, Datenzentrum für Sonnenbeobachtungsdaten von den deutschen Sonntenteleskopen auf Teneriffa, Spanien; diese frühe Version war auf MongoDB/GridFS aufgebaut und eine weitgehende Automatisierung der Datenverarbeitung und die Inkorporation von Daten Dritter stand nicht im Vordergrund. Obwohl bereits diese Version des SDC über unsere ursprünglichen Erwartungen hinaus erfolgreich, schnell und robust war, wurde relativ bald klar, dass es aus wissenschaftlicher Sicht vorteilhaft wäre, sich für Daten aus anderen Quellen zu öffnen und die technische Grundlage durch Standardprodukte, die in ähnlichen nationalen und europäischen Bestrebungen für das Datenmanagement verwendet werden, zu ersetzen.

Nach zwei Jahren der Entwicklung, des Testens und der Integration ist nun die Umstellung der technischen Grundlage des SDC von MongoDB/GridFS auf Rucio/dCache abgeschlossen ist. Alle Metadaten und nicht wissenschaftlich nutzbaren Daten werden weiterhin in einer zusätzlichen MongoDB gehostet; einer der nächsten Schritte wird darin bestehen, diese Trennung für den Benutzer völlig transparent zu machen, indem wir die Anwendungsprogrammierschnittstelle (API) von Rucio für Metadatenabfragen in unsere MongoDB erweitern.

Rucio ist eine Datenverwaltungslösung, die in mehreren modernen Experimenten und groß angelegten Datenprojekten eingesetzt wird, z. B. in Punch4NFDI auf nationaler und ESCAPE auf europäischer Ebene. Der vollzogene Übergang legt somit den Grundstein für eine nahtlose Föderation und Interoperabilität mit diesen Datenbeständen.

Auch die Web-Schnittstelle zum Auffinden und dem Download von Daten im SDC wurde stark verbessert. Früher auf jQuery, SemanticUI und Java EE basierend, ist sie nun eine moderne, erheblich beschleunigte Single-Page-Applikation auf Basis von Next.js, Bootstrap und Spring Boot, bei der die Suchparameter nachträglich direkt auf der Ergebnisseite angepasst werden können.

Die erreichten Meilensteine in der Datenverwaltung, der Online-Datensuche und der zugrundeliegenden Datenabstraktionsschicht stellen einen bedeutenden Schritt in Richtung unseres Ziels dar, Solardaten über verschiedene Instrumente und Quellen hinweg zu korrelieren, indem wir Daten aus Drittquellen in einer homogenen, standardisierten Weise zusammenführen, verarbeiten und anbieten.

Das SDC Tech Team wird sich als nächstes auf den automatischen Datentransport zwischen OT und SDC, die Implementierung von standort- und datenebenenunabhängigen Zugriffs-Embargos (von denen bis heute nur ein Proof of Concept existiert) und die Einspeisung neuer Daten aus anderen Quellen als OT konzentrieren.

Screenshot der neuen, modernen single-page Websuchschnittstelle zum Auffinden von Daten im SDC über das Web.

SDC-Hybridarchitektur auf der Grundlage von Rucio/dCache (für wissenschaftliche Daten) und MongoDB (für alle anderen Daten und Metadaten).

Zurück