Serverprobleme am 15.04.2016

Hier ruhen alte Ankündigungen, die bereits mindestens 2 Jahre zurückliegen.

Moderatoren: Forenmoderatoren, Entwickler, Community Manager

Gesperrt
Benutzeravatar
Eddard
Drachenfreund
Beiträge: 879
Registriert: 15. Apr 2014, 10:46

15. Apr 2016, 10:27

Liebe Spieler,

seit ca. 05:00 Uhr hat unser Serveranbieter Probleme, weshalb Magoia leider nicht mehr erreichbar ist.
Wir arbeiten bereits eng mit dem Support des Providers zusammen, um die Probleme möglichst schnell in den Griff zu bekommen.

Wie lange es dauert können wir zum aktuellen Zeitpunkt noch nicht sagen, wir halten euch jedoch auf dem Laufenden.

Bitte entschuldigt die Unannehmlichkeiten.

Viele Grüße,
euer Magoia-Team
Bild
"Meine Nuss ist verschwunden... hast du meine Nuss gegessen?... Du schuldest mir eine neue Nuss."
Benutzeravatar
Eddard
Drachenfreund
Beiträge: 879
Registriert: 15. Apr 2014, 10:46

15. Apr 2016, 16:05

Hallo zusammen,

nun läuft das spiel zwar, jedoch sehr langsam und ein paar Spieler kommen leider immer noch nicht rein.

Deshalb nehmen wir das Spiel für ca. eine Stunde vom Netz um gemeinsam mit unserem Provider an einer Lösung zu arbeiten.

Wir melden uns dann wieder, wenn wir Neuigkeiten haben.

Viele Grüße,
Eddard
Bild
"Meine Nuss ist verschwunden... hast du meine Nuss gegessen?... Du schuldest mir eine neue Nuss."
admin
Administrator
Beiträge: 1
Registriert: 9. Dez 2013, 11:56

15. Apr 2016, 20:22

Liebe Spieler,

da wir das Problem noch nicht ganz ausfindig machen konnten, werden wir jetzt einige Updates rückgängig machen um es zu lokalisieren. Bitte spielt danach einfach weiter, da wir beobachten möchten, wie sich die Serverlast verändert.

Vielen Dank.

Euer Magoia Team
Benutzeravatar
poilf
Administrator
Beiträge: 5
Registriert: 10. Jan 2014, 10:07

18. Apr 2016, 17:13

Ich würde gerne noch etwas detaillierter schreiben was passiert ist und wie wir damit umgehen.

Was passiert ist
Um 01:28 Uhr MEZ springt die Auslastung des Magoia Server auf einen extrem ungewöhnlichen Wert. Effekt ist das die Ausführungszeiten für Magoia deutlich schlechter werden. Das ist noch nicht wirklich aufgefallen, weil zu dieser Zeit nur sehr wenige Spieler online sind und der Server noch alle Anfragen rechtzeitig beantworten konnte.
Um 05:25 Uhr MEZ wird die Performance von Magoia so schlecht das die Überwachungstools von Trollgames Alarm schlagen per E-Mail, SMS und anrufen. Die ersten User bemerken das Magoia sehr schlecht läuft. Ein Techniker von Trollgames ist ab ca. 06:00 Uhr im Büro und arbeitet daran dem Problem auf den Grund zu gehen. Leider kann er nur feststellen das die Magoia Software ohne Fehler, aber extrem langsam arbeitet und geht deswegen davon aus das es ein Problem mit dem Server gibt. Da der Provider von Trollgames erst ab 09:00 Uhr telefonisch erreichbar ist, konnte erstmal nichts unternommen werden.
Um ca. 11 Uhr MEZ hat unser Provider beschlossen den Magoia Server auf neue Hardware zu verschieben um ein Hardwareproblem auszuschließen. In dieser Zeit war Magoia prinzipbedingt nicht erreichbar. Nach dem Umzug lief Magoia für kurze Zeit normal um dann wieder Performancemäßig einzubrechen. Es konnte bisher ausgeschlossen werden das es sich um eine Attacke handelt, oder ein Hardwaredefekt.
Um ca. 16 Uhr MEZ wurde der Magoia Server komplett neu installiert um etwaige Systemsoftwareprobleme ausschließen zu können. Für diese Zeit war Magoia auch wieder nicht erreichbar. Nachdem klar wurde das auch der Umzug auf eine neue Hardware und eine komplette Neueinrichtung nicht hilft, wurde Magoia auf ein Serversystem umgezogen, von dem bekannt ist dass es gut funktioniert, aber nicht für sehr große Lasten ausgelegt ist. Um zu verhindern dass das Serversystem nicht überlastet wird, wurde ein Loadbalancing eingerichtet, wo die Last auf mehrere Server verteilt werden kann.
Um ca. 22:13 Uhr MEZ war Magoia wieder erreichbar.

Wie wir damit umgehen
Leider ist die Ursache für die plötzliche Verschlechterung der Performance um 01:28 Uhr noch nicht bekannt. Unser Provider hat alles getan um uns ein funktionierendes System zu Verfügung zu stellen und wir sind weiter im Kontakt um der Sache auf den Grund zu gehen. Trotz das wir nicht wissen was die Ursache war, wollen wir sicherstellen das wir Magoia immer in einer guten Geschwindigkeit online haben. Folgende Maßnahmen haben wir bisher ergriffen:
1. Wir haben unsere Überwachungstools um einige Überprüfungen erweitert, weil wir gelernt haben das wir bestimmte Fehlersituationen schneller erkennen könnten.
2. Wir haben unser Datenbanksystem angepasst um mit weniger Ausfallzeiten Magoia auf einen neuen Server umziehen zu können, auch wenn wir nicht vorhaben das ständig zu tun.
3. Wir sind im Kontakt mit unserem Provider um zu wissen was um 01:28 Uhr schief gelaufen ist.
4. Wir überprüfen unsere Software ob es irgendwo Flaschenhälse gibt, die einen Server in die Knie zwingen kann.
5. Wir testen gerade Programme mit denen wir genau vorhersagen können wie gut ein Server mit der Last von Magoia zurecht kommt. Das soll zum einen verhindern das wir bei einem Umzug die Situation "verschlimmbessern" und zum anderen ermöglichen das wir unseren problematischen Server so lange mit echter Last testen können, bis wir genau wissen was das Problem ist.

Das es zu so einem massiven Ausfall kam tut uns sehr leid und wir arbeiten daran das so etwas nicht wieder vorkommt. Man muß allerdings dazu auch sagen das wir nicht auf einem technischen Komplexitätsniveau arbeiten wie z.B. Google oder Facebook, die sich die Erreichbarkeit ihrer Systeme mehrere hundertausend Euro im Monat kosten lässt. Das sich der Server von Magoia auf so unerklärliche Weise verändert hat, ist etwas das viele Ursachen haben kann und die meisten davon liegen außerhalb unserer Zugriffsmöglichkeiten. Wir können z.B. nicht überprüfen ob der Netzwerkswitch an den unser Server angebunden ist ein Problem hat, da müssen wir uns auf unseren Provider verlassen, der sich in der Vergangenheit als sehr zuverlässig erwiesen hat. Falls es aber dazu kommen sollte das solche unerklärlichen Probleme öfter als zwei mal im Jahr auftreten, werden wir uns nach neuen technischen Lösungen umschauen.
Gesperrt