Oderland Status

Senast uppdaterad 2024-07-27 10:27 CEST

Incidentrapport

Problem med shared

Den här incidenten påverkade: Webbhotell

Postmortem

20 Feb 2024 14:20 CET

Vad hände?

Ett av våra lagringskluster som används för våra delade webbhotellsservrar påverkades av en hårdvarurelaterad störning, vilket i vissa fall orsakade höga svarstider och i andra fall att tjänsten var otillgänglig.

Varför hände det?

Problemet uppstod p.g.a. problem med ett nätverkskort i en av våra lagringsservrar som resulterade i att servern "flappade".

Vanligtvis är det inget problem om ett nätverkskort slutar fungera, då servrarna har redundanta nätverksanslutningar. Det är inte heller några problem om en lagringsserver kopplas från klustret, då systemet är byggt för att fungera med färre antal servrar utan problem. Däremot har vi noterat en känslighet för när en server kopplas från och sedan återansluter igen - om och om igen.

Vad kommer ni göra för att det inte ska hända igen?

Vi har dels planerat in ett underhåll för att byta hårdvara på servern i fråga. Men har även ett pågående arbete med att se över logiken för hur en lagringgserver utesluts ur klustret under en längre period, för att undvika följdeffekter av "flappandet".

Vi ber om ursäkt för de problem som uppstod och tackar för ditt tålamod.

Historik

Åtgärdad

Problemet är åtgärdat sedan 04:28 och vi har övervakat systemen under dagen för att verfiera att allt fungerar som förväntat.

Övervakar

Problemet är löst. Vi återkommer under dagen med mer information om vad som hände.

Identifierad

Det är just nu problem med att komma åt ett större antal delade webbhotellsservrar. Systemen svarar antingen långsamt eller inte alls. Vi jobbar på att lösa problemet.