Vad hände?
Flera virtuella servrar slutade svara efter att en av våra switchar upplevde en kort störning. Trots att nätverket återhämtade sig som förväntat, förblev vissa virtuella maskiner otillgängliga tills vi manuellt återställde deras nätverksfunktionalitet.
Varför hände det?
Incidenten orsakades av en bugg i hypervisorns nätverkshantering, som triggades av den tillfälliga nätverksstörningen. När switchen tappade anslutningen under en kort period, rensade hypervisorn oväntat viktig information om nätverksadresser och misslyckades med att återskapa den automatiskt. Detta gjorde att vissa virtuella maskiner inte längre kunde ta emot trafik, trots att nätverksinfrastrukturen i övrigt fungerade korrekt.
Vad gör vi för att det inte ska hända igen?
Vi har implementerat en workaround för att undvika att buggen triggas vid framtida nätverksstörningar. Genom att justera hur hypervisorn hanterar och uppdaterar nätverksinformationen säkerställer vi att trafiken fortsätter att flöda korrekt, även om en switch tillfälligt tappar anslutningen.
Vi beklagar de problem detta inneburit och arbetar löpande för att minimera både störningar och deras påverkan.