Ein RAID-Verbund ist eine tolle Sache, man schreibt seine Daten nicht nur auf eine, sondern auf mehrere Festplatten und schon kann man recht sicher sein, dass nicht gleich alles verloren ist, nur weil mal eine Festplatte den Dienst quittiert. Soweit so gut. Nun gibt es allerdings RAID-Controller (die Karte, die eben diesen Verbund verbindet), die kaputt – oder aber extrem langsam sind, dann macht das Ganze auch keinen Spass mehr.
Soviel zur Vorrede, nun begab es sich bei einem Kunden, dass gerade dieser Controller defekt war und wir daher ein Software-RAID aufgesetzt haben, bei diesem braucht man dann keinen Controller, sondern eben nur eine Software, in diesem Fall das Betriebssystem. Funktioniert auch ganz gut, ist vielleicht nicht ganz so toll/sexy/uiuiui aber was solls. RAID Verbünde haben allerdings auch einen Nachteil, im Modus RAID5 reagieren diese ganz empfindlich darauf, wenn man einfach beim Schreiben den Rechner abschaltet, sprich den Strom klaut. Dann muss die Spiegelung erst wieder syncronisiert werden, dies dauert je nach Größe ein paar (mehr) Stunden.
Nun ist auch gut mit der zweiten Vorrede, was nun geschehen ist: Am Montag Morgen sollte ein Techniker (nicht von uns) bei besagtem Kunden eine Software installieren. Damit alles glatt geht schaute ich um 7:45 Uhr Morgens nochmal nach, ob alles am Server korrekt läuft – tat es. Gegen Mittag schlugen wir dann auch bei dem Kunden auf, eigentlich um zu sehen ob alles funktioniert hat und um uns nochmal die Sicherungsstrategie der Software erklären zu lassen. Eigentlich. Tatsächlich war der Techniker immernoch am Installieren und fluchte rum, dass der Server ja viel zu langsam sei, dass das ja alles ganz schlecht sei und bla bla bla. Auf jeden Fall wären die Geräte SEINER Firma ja viel besser, dies legte er dann auch dem Kunden in einigen Bemerkungen nahe. Tatsächlich lief die Installation schrecklich langsam ab und es wurde auf den Festplatten herum gehakt wie nichts gutes. Dies solle ja angeblich auch ein sehr Platten-intensiver Prozess sein.
Irgendwann fragte ich mal so in den Raum, ob es nicht sein könnte, dass irgendwas das RAID zerschossen hat und der Server dieses nun neu baut – dabei wird natürlich alles quälend langsam, da die Festplatten voll ausgelastet sind. Und siehe da, so war es dann auch, entsprechend stand die Frage im Raum was es kaputt gemacht hatte. Nach einigem weiteren Rumklicken und einlesen fand Benni dann im Log, dass der Server um 8:33 unplanmäßig neugestartet wurde – ohne Angabe von Gründen. Sei angemerkt: Um dieses System neu zu starten MUSS man einen Grund eintippen, und wenn es ein “x” ist. Und wir erinnern uns: Strom einfach wegnehmen ist eine dumme Idee.
Auf jeden Fall habe er damit nichts zu tun, da wäre er noch garnicht da gewesen…Ahja. Nach nachfrage beim Kunden stellte sich dann heraus, dass er so gegen 8:25 Uhr da war…also VOR dem Aufall. Und nachdem ich dann nochmal bei ihm fragte, ob er vielleicht irgendwas an den Server gesteckt hätte meinte er, dass er nur ne Tastatur/Maus drangesteckt habe, die ging nicht, nach einem Neustart dann aber doch. Und da haben wirs dann…wie hat er den Server neu gestartet wenn die Tastatur und Maus nicht geht..und weiter, wie hat er einen Neustart gemacht, ohne einen Grund anzugeben…na wenn das mal nicht der ungeplante Ausfall war…Reset drücken unterbricht auch mal kurz die Versorgung bzw. hat den gleichen Effekt.
Ende vom Lied: Der Kunde weiß nun, dass unser Server doch nicht so scheiße sein kann, die andere Firma da hingegen offenbar durchaus und die Mehrarbeit durch den “ach so langsamen Server” wird wohl auch nicht bezahlt werden – selbst verschuldete Verzögerungen kann man ja schlecht versilbern.