INFO: Umgang und Notfallprozedur bei sehr heißen Außentemperaturen in der Region Karlsruhe
Sehr heiße Außentemperaturen, Kühlung der Serverräume und Betrieb der VMs
Das sehr heiße Außentemperaturen (> 35 Grad Celsius im Schatten) jede Kühlung massiv fordern, ist sicherlich den meisten Nutzer:innen der bwCloud bewusst. Das Problem einer adäquaten Innenraumkühlung bei sehr heißen Außentemperaturen hat nicht nur die Deutsche Bahn, sondern muss von den Server- und Infrastrukturbetreibern ebenfalls gelöst werden. Um die Temperatur und Luftfeuchtigkeit in Serverräumen konstant zu halten und um die durch den Betrieb der Hardware anfallende Wärme abzuführen, kommen große und komplexe Kühlungs- und Klimasysteme die aus mehreren Komponenten bestehen zum Einsatz. Das muss nicht immer nur ausschließlich die "klassische Kaltluft" sein, mit der die Hardware gekühlt (und damit geschützt) wird, oft ist es ein Zusammenspiel aus Wärmabtransport direkt in der Hardware und Kühlung der Innenraumluft.
Dennoch kommt jedes System ab einer bestimmten Außentemperatur an die Grenzen der Belastbarkeit. Wenn in solchen Heißtemperaturphasen auch noch weitere ungünstige Faktoren wie eine schwankende Stromversorgung hinzukommen, kann die Situation eintreten, dass die Kühlsysteme überlastet sind und temporär abgeschaltet werden müssen.
Maßnahmen im Falle einer temporären Abschaltung der Kühlsysteme
Oberste Direktiven bei allen Maßnahmen lauten:
- Sicherstellen der Integrität der Daten (VMs, attached storage usw), Vermeidung von Datenverlust
- Sicherstellen der Funktionsfähigkeit der Hardware
Nach diesen beiden Maßgaben sind die Maßnahmen im Falle einer temporären Abschaltung des Kühlsystems orientiert.
Sollte der Fall in der bwCloud Region Karlsruhe eintreten, werden wir immer versuchen
- zuerst alle laufenden VMs ordnungsgemäß herunterzufahren bevor
- die Hardware ausgeschaltet wird.
Fragen & Antworten
- Frage: Werden die Nutzer:innen via E-Mail vor so einer Notfallabschaltung der bwCloud Region Karlsruhe informiert?
-
Antwort: Nein, in der Regel bleibt für solche Maßnahmen keine Zeit mehr.
- Frage: Werden die heruntergefahrenen VMs nach Wiederherstellung der Kühlung automatisch hochgefahren?
-
Antwort: Wir versuchen die VMs, die heruntergefahren wurden, nach Wiederherstellung der Kühlung hochzufahren. Es kann in einzelnen Fällen dabei zu Verzügerungen kommen, die von uns manuell untersucht werden müssen.
- Frage: Wo finde ich Infos zum aktuellen Stand sollte die Region Karlsruhe offline genommen worden sein?
- Antwort: Erster Anlaufpunkt: diese Website. Allerdings läuft dieser Webserver ebenfalls in einer Virtualisierungsumgebung, weshalb auch diese offline sein könnte. In diesem Fall gibt es noch die Ausweichseite https://scc.fail