IT braucht Awareness!

Letzte Woche standen die Bänder bei Toyota still – wegen zu wenige Speicher in einem Server. Bei Vielen mag das Unverständnis „wie kann denn sowas passieren?“ oder ggfs. sogar eine gewisse Schadenfreude ausgelöst haben – viele CIO’s oder IT-Manager werden jedoch erst mal erleichtert durchgeatmet haben:

„Gott sei Dank ist das nicht bei uns gewesen“.

Das Managen einer modernen IT-Landschaft ist eine Herkules-Aufgabe. Man hat es mit gewachsenen Strukturen zu tun, historisch bedingten Altlasten „schalte das Ding mal besser nicht aus!“, wenig IT-Verständnis „wir bauen Autos, keine Software“, Budget- und Ressourcenthemen, gefährlichem Halbwissen, und einer schier unerreichbaren Erwartungshaltung des Top-Managements an die IT. Es sollen zukunftssichere Strategien entwickelt werden, sämtliche Hype-Themen adressiert werden „natürlich nutzen wir KI“, „selbstverständlich sind wir Vorreiter bei Big-Data“, „IOT machen wir schon lange“, „klar setzen wir auf Microservices“, „Cloud: alter Hut bei uns“… und so ganz nebenbei sollen die zahllosen IT-Projekte, die im Unternehmen laufen, noch alle homogen zusammenpassen und termingerecht umgesetzt werden.

Und wenn am Ende tatsächlich alles reibungslos läuft, dann merkt es keiner, weil von IT – aus welchen Gründen auch immer – erwartet wird, dass sie funktioniert.

Man sollte sich daher immer wieder bewusst machen, wie komplex IT-Systeme in Unternehmen sind. Anders, als bei einer Fertigungsstraße, wo kompliziert aussehende Geräte für jeden sichtbar sind, wird IT meist durch Software gesteuert, deren Quellcode „eh keiner versteht“ und der ja „nur ein paar Zeilen“ sind.

Jede Schnittstelle zwischen Systemen erhöht das Ausfallrisiko und multipliziert die Ausfallwahrscheinlichkeit der beteiligten Systeme. Wenn System A eine Ausfallwahrscheinlichkeit von 5% hat und System B ebenso, dann führt eine Schnittstelle zwischen den beiden Systemen dazu, dass das System A+B eine Ausfallwahrscheinlichkeit von mindestens 1-(0.95 x 0.95) hat, also von 9,75%. Je mehr System oder Dienste wir also verbinden, desto höher das Risiko eines Ausfalls.

Ich bin sicher, dass auch bei Toyota frühzeitig ein Lämpchen in einem Tool eines IT-Service Mitarbeiters aufleuchtete, dass in Server XYZ der Speicher knapp wird. Ich bin auch sicher, dass dies entsprechend gemeldet, ein Antrag auf Aufrüstung geschrieben, wahrscheinlich sogar bewilligt, budgetiert und für’s nächste oder übernächste Quartal eingeplant wurde. Wahrscheinlich ist, dass das Teilprojekt, welches die Wartung durchgeführt hat, die dann zum Fehler führte und der Teilbereich, der den Server verantwortet hat, nicht voneinander wussten.

Vor Allem aber bin ich sicher, dass solche Fehler überall passieren können!

IT muss fest im Kern eines Unternehmens verankert werden, IT braucht „Awareness“ (sorry, hab noch kein gutes Deutsches Wort dafür gefunden), IT muss ernst genommen werden und braucht fähige Köpfe, die Tag für Tag daran arbeiten, dass solche Fehler möglichst selten auftreten!