Wartung erfolgreich abgeschlossen
Am Montag den 18.4.2016 wurde mit einer "bwCloud-weiten" Wartung aller vier Betriebsstandorte begonnen. Von dieser Maßnahme war der gesamte bwCloud Betrieb betroffen, da alle Standorte für die Dauer der Wartung nicht mehr für die Nutzer der bwCloud zur Verfügung standen.
Da diese Wartung die erste ihrer Art im Rahmen des Betriebs der bwCloud Infrastruktur war und weil nicht nur die OpenStack Installationen an den Standorten sondern auch andere Komponenten und Systeme überprüft und auf den neusten Stand gebracht wurden, entschied sich das bwCloud-Team zu einer umfassenden Wartung der gesamten bwCloud.
Umzug in die produktive bwIDM-Föderation
In einer ersten Phase wurde die zentrale Authentifizierungskomponente "Keystone" in Freiburg deaktiviert. Auf diese Weise wurde verhindert, dass sich Nutzer_innen versehentlich während der Durchführung der Updateprozeduren anmeldeten. Nach Deaktivierung des Zugangs für Nutzer_innen wurde mit der Umstellung innerhalb der bwIDM-Föderation begonnen. Dabei wurde der bwCloud Service von der Test- in die Produktivföderation umgezogen.
Leider konnte nicht verhindert werden, dass durch den Wechsel der Föderation sämtliche bislang angelegten Nutzerdaten verloren gingen. Das umfasste neben den Accountdaten auch alle bislang von den Nutzer_innen angelegten Ressourcen (virtuelle Maschinen, Daten etc.): sie mussten von den Systemen der vier Betriebsstandorten gelöscht werden.
Da für diesen Vorgang die gesamte bwCloud-Infrastruktur heruntergefahren wurde, nutzte das bwCloud-Team die Gunst der Stunde und nahm sich alle Komponenten (Kernel, Betriebssystem, OpenStack Framework) an den Betriebsstandorten vor und brachte diese auf den neusten Stand.
Update der OpenStack-Komponenten von Kilo auf Liberty
Den größten Anteil an den Wartungsarbeiten nahm die Vorbereitung und Durchführung des Upgrades der OpenStack-Komponenten ein. Dazu wurden die einzelnen Komponenten bereits Wochen vor der Wartung einzeln überprüft und innerhalb spezieller virtueller Maschinen "im trockenen" auf den neuen Versionsstand gebracht. So konnten mögliche Probleme im Vorfeld identifiziert und bei der tatsächlichen Wartung entsprechend eingeplant werden.
Nach vier Tagen war die bwCloud wieder online
Nach drei Tagen waren die Wartungsarbeiten weitestgehend abgeschlossen, am vierten Tag wurde mit den ersten Tests und Überprüfungen der Prozesse begonnen. Alle OpenStack Installationen wurden erfolgreich von Kilo auf das Release Liberty umgestellt, es gab keine nennenswerten Probleme, Störungen oder Ausfälle.
Was jetzt noch folgt sind kleinere Aufräumarbeiten, während die neuen Installationen in den nächsten Wochen intensiv getestet und beobachtet werden.
Wenn die Systeme weiterhin stabil laufen haben wir mit dieser Wartung einen großen Schritt in Richtung einer betriebsfesten bwCloud gemacht. Großer Dank gilt jetzt schon den Kollegen an den Standorten, die diese Wartung durchgeführt haben, namentlich
- Konrad Meier in Freiburg,
- Oleg Dulov in Karlsruhe,
- Jan Siersch in Ulm und
- Maxim Schwarz in Mannheim.
Natürlich danken wir den Nutzer_innen für die aufgebrachte Geduld.