Oderland Status

Senast uppdaterad 2025-04-04 06:40 CEST

Incidentrapport

Problem att nå flera tjänster

Den här incidenten påverkade: Webbhotell

Postmortem

19 Feb 2025 02:17 CET

Vad hände?

Flera virtuella servrar slutade svara efter att en av våra switchar upplevde en kort störning. Trots att nätverket återhämtade sig som förväntat, förblev vissa virtuella maskiner otillgängliga tills vi manuellt återställde deras nätverksfunktionalitet.

Varför hände det?

Incidenten orsakades av en bugg i hypervisorns nätverkshantering, som triggades av den tillfälliga nätverksstörningen. När switchen tappade anslutningen under en kort period, rensade hypervisorn oväntat viktig information om nätverksadresser och misslyckades med att återskapa den automatiskt. Detta gjorde att vissa virtuella maskiner inte längre kunde ta emot trafik, trots att nätverksinfrastrukturen i övrigt fungerade korrekt.

Vad gör vi för att det inte ska hända igen?

Vi har implementerat en workaround för att undvika att buggen triggas vid framtida nätverksstörningar. Genom att justera hur hypervisorn hanterar och uppdaterar nätverksinformationen säkerställer vi att trafiken fortsätter att flöda korrekt, även om en switch tillfälligt tappar anslutningen.

Vi beklagar de problem detta inneburit och arbetar löpande för att minimera både störningar och deras påverkan.

Historik

Åtgärdad

Systemen har fungerat stabilt och som förväntat de senaste dagarna, och vi stänger därför denna incident. Den bakomliggande orsaken har åtgärdats för att förebygga liknande problem framöver. Vi kommer att uppdatera med mer information vid ett senare tillfälle om vad som inträffade.

Övervakar

Problemet har åtgärdats och alla tjänster är igång. Men vi fortsätter att övervaka.

Identifierad

Vi har identifierat ett nätverksrelaterat problem som påverkar ett 30-tal servrar intermittent. Vi jobbar just nu med att åtgärda problemet, server för server.

Undersöker

Vi har fått rapporter om att nå flera tjänster i ett av våra datacenter. Felsökning pågår.