Orsak till att problemet uppstod ser ut att vara relaterat till att daglig backup påbörjades för servern kort innan servern blev onåbar.
Ny daglig backup för servern har kunnat köras igenom utan problem.
Vi kommer fortsätta undersöka loggar närmare under dagtid för att se hur vi kan undvika att samma problem kan ske på nytt.
Allt har sett bra ut sedan senaste uppdateringen. Vi stänger nu incidenten som åtgärdad.
Problemet orsakades av att en process på en av våra lagringsservrar kraschade till följd av out of memory, vilket ledde till hög I/O-wait för ett begränsat antal Managed Server-servrar under en kortare period. I praktiken innebar det att berörda servrar antingen svarade långsamt eller inte alls under den perioden.
Vi har inte kunnat fastställa exakt vad som utlöste kraschen utifrån befintliga loggar och metrics. Vi har därför vidtagit åtgärder för att generera bättre dumpfiler om situationen skulle uppstå igen.
MariaDB fungerar åter som vanligt. Orsaken var att InnoDB motorn kraschade och fastnade i recovery, vi kommer följa upp med eventuell bug rapport till MariaDB.