Tumblelog by Soup.io
Newer posts are loading.
You are at the newest post.
Click here to check if anything new just came in.

December 31 2010

Skype – Ausfall nun geklärt

Einigen wie auch mir wird es ähnlich gegangen sein, wer sich um den 22. Dezember einloggen wollte, konnte entweder ewig auf die Loginserver warten oder kam erst gar nicht soweit: ein großer Teil des Skype – Netzwerkes war ausgefallen. Wer sich doch einloggen konnte, war noch nicht über dem Berg. Entweder wurde man selbst oder die Kontaktliste als offline angezeigt. Und war selbst das Problem zeitweise überwunden, konnte man das Telefonieren vergessen. Die Gründe dafür sind nun bekannt.

Sie werden im CIO – Blog von Skype nun genau erläutert. Problematisch war das ein Cluster von Servern, die für die Vermittlung von Offline – Nachrichten zuständig sind, welche die Nachrichten nicht mehr ordnungsgemäß übertragen konnten, was wiederum dazu führte, dass Windows – Clients mit der Version 5.0.0125 abstürzten. Pech für Skype: 50% der Skype – Teilnehmer besaßen diese Version. Somit fielen 25 – 30% öffentlichen Supernodes aus, was zu einer erhöhten Belastung der restlichen Supernodes führte. Diese wurde nicht nur überlastet, ein eingebauter Schutz griff ein, was zu einem Abschotten der Supernodes führte, was dann in einen Teufelskreis führte. Die Supernodes, die online waren, wurden stärker belastet, woraufhin diese sich wiederum abschotteten und infolgedessen die danach noch übrigen Supernodes eine noch stärkere Last hatten und sich abschotteten usw. usf.
Die Supernodes sind deswegen so wichtig für das Skype – Netzwerk, da sie wiederum wie eine Art Telefonbuch agieren und verbindenden Skype – Clients mitteilen, unter welcher Adresse sich die Zielclients befinden. Dabei ist jeder Skype – Client auch zum Teil ein Supernode. Fallen diese Server aus, wissen die einzelnen Clients nicht mehr, wo sich sich finden sollen.
Leider ist es auch mit einem einfachen Neustart des Supernodes nicht getan. Es brauch erst wieder eine Zeit bis der Supernode im Netzwerk registriert ist.

Unglücklicherweise ereignete sich der Crash des Server – Cluster kurz vor den Spitzenzeiten im Skype – Netzwerk. Noch viel schlimmer für Skype war dann noch, dass sich die grade abgestürzten Windows – Clients wieder einloggen wollten und den Effekt noch verstärkten.

Abhilfe schuf dann Skype wenige Zeit später, indem sogenannte “Mega – Supernodes” aufgesetzt wurden, die dann die Aufgabe der ausgefallenen Supernodes übernahmen. Ein erster Versuch schlug aufgrund der massiven Überlastung des Netzwerkes fehl, konnte aber mit einem zweiten Nachrüsten stabilisiert werden.

Skype möchte dies nun künftig ändern, indem sie überlegen auf Updates hinzuweisen oder gar einen Auto – Updater in Skype zu integrieren und die Infrastruktur zu stützen und Server einzusetzen, die auf solche Situationen vorbereitet sind.