Cyber-Resilienz und Disaster Recovery für virtualisierte Netzwerkumgebungen

Ein führender deutscher Telekommunikationsanbieter führte angesichts wachsender Bedrohungen durch Cyberangriffe und Ransomware ein neues, kritisches Risikoszenario ein. Dieses Szenario sieht einen landesweiten Totalausfall der virtualisierten Netzwerkumgebung vor. Betroffen waren zentrale virtualisierte Plattformen und darauf gehostete kritische Netzwerkfunktionen aus den Bereichen Mobile Voice, Mobile Data, Fixed Voice und Fixed Data. Zur Absicherung dieses Szenarios sollte ein Cyber Recovery Vault eingeführt werden, der im Katastrophenfall die Wiederherstellung kritischer Infrastruktur ermöglicht. 7P unterstützte das eineinhalbjährige Cyber-Resilienz-Projekt über die gesamte Laufzeit als externer Dienstleister im Projektmanagement. Der Fokus lag auf der Planung, Koordination und Steuerung der Analyse-, Design- und Implementierungsaktivitäten. Hintergrund des Projekts sind u.a. Anforderungen aus NIS2, Cyber Security und Cyber Resilience Act der EU gewesen.
Telekommunikation

Die Ausgangssituation

Der Kunde musste die Widerstandsfähigkeit seiner virtualisierten Netzwerkumgebung im Falle eines schwerwiegenden Cyberangriffs bewerten. Das neu eingeführte Risikoszenario beschreibt einen landesweiten Totalausfall zentraler virtualisierter Plattformen und darauf gehosteter kritischer Netzwerkfunktionen für Mobile Voice, Mobile Data, Fixed Voice und Fixed Data.

Zur Absicherung dieses Szenarios wurde die Einführung eines Cyber Recovery Vaults definiert, der im Katastrophenfall die Wiederherstellung kritischer Infrastruktur ermöglicht.

Zusätzlich bestand ein unternehmensintern definiertes Service-Level-Target, das vorsah, einen wesentlichen Teil der kritischen Services innerhalb eines festgelegten Zeitrahmens wiederherzustellen.

Zu Projektbeginn war nicht vollständig transparent, wie belastbar die bestehende Wiederherstellungsfähigkeit tatsächlich war. Offen war, welche Recovery-Dauern realistisch erreichbar waren. Ebenso musste geprüft werden, welche Systeme technisch in den Cyber Recovery Vault integriert werden konnten und welche Abhängigkeiten den Wiederanlauf kritischer Services beeinflussen würden.

Darüber hinaus mussten auch organisatorische Engpässe und bestehende Recovery-Gaps sichtbar gemacht werden. Die virtualisierte Infrastruktur war groß und heterogen aufgebaut. Deshalb ließ sich das definierte Wiederherstellungsziel nicht allein aus bestehenden Konzepten ableiten, sondern musste systematisch überprüft werden.

Die Aufgabe

Im Rahmen des Cyber-Resilienz-Projekts übernahm 7P das Projektmanagement. Die Aufgabe bestand darin, die Analyse der betroffenen Netzwerkumgebung zu strukturieren, die weiteren Projektschritte zu koordinieren und die Umsetzung bis hin zu Recovery-Tests und Management-Reportings zu begleiten.

Zu Beginn mussten der Compliance-Status der betroffenen Umgebung ermittelt werden. Auf dieser Grundlage wurden kritische Systeme und ihre Abhängigkeiten identifiziert. Bestehende Backup-/Restore-Konzepte wurden bewertet, um zu ermitteln, welche Voraussetzungen für eine Wiederherstellung bereits erfüllt waren und wo Recovery-Gaps bestanden.

Ein weiterer Schwerpunkt lag auf den Wiederherstellungszeiten. 7P unterstützte dabei, erste Recovery-Dauern zu ermitteln. Für betroffene Systeme wurden Wiederherstellungsprozesse und -pläne erstellt. Zudem wurde ein übergeordneter Disaster Recovery Plan erstellt, welcher die Reihenfolge/Gleichzeitigkeit der Wiederherstellung der Einzelsysteme und Services unter Berücksichtigung einer Standortorchestrierung zeigt.

Anschließend wurden die geplanten Recovery-Abläufe über Tests und Dry Runs überprüft. 7P bereitete die Ergebnisse für das Management auf und unterstützte Eskalationen, wenn kritische Risiken oder Zielabweichungen sichtbar wurden.

Das Vorgehen

Zur Bewertung der Cyber-Resilienz wurden die bestehenden virtualisierten Netzwerkumgebungen systematisch analysiert. Dabei betrachtete 7P VMware-basierte Infrastruktur- und Netzwerkplattformen sowie kritische Netzwerkfunktionen aus dem Mobilfunk- und Festnetzbereich.

Die weiteren Arbeitsschritte wurden entlang der Wiederherstellungsfähigkeit strukturiert.

  • Backup-/Restore-Konzepte prüfen: Bestehende Konzepte wurden bewertet, um festzustellen, ob sie für eine Wiederherstellung im definierten Katastrophenszenario ausreichen.
  • Recovery-Hindernisse sichtbar machen: Technische Hindernisse und organisatorische Einschränkungen wurden analysiert, da beide den Wiederanlauf kritischer Services verzögern können.
  • Abhängigkeiten bewerten: Drittanbieter-Abhängigkeiten, Wiederherstellungsreihenfolgen und kritische Pfade wurden herausgearbeitet, um die Reihenfolge der Wiederherstellung belastbarer festlegen zu können.
  • Recovery-Prozesse aufbauen: Es wurden Wiederherstellungsprozesse und Testmethodiken definiert, um Annahmen zur Recovery nicht nur zu dokumentieren, sondern auch zu überprüfen.
  • Tests und Dry Runs durchführen: Die geplanten Abläufe wurden in Recovery-Tests und Dry Runs geprüft.
  • Integration in den Dell Cyber Recovery Vault steuern: Für die Integration in den Vault wurden geeignete Systeme gesteuert.

Die Zusammenarbeit erfolgte bereichsübergreifend mit den Abteilungen Engineering, Infrastruktur, Cybersecurity, Business Continuity Management, Governance, Incident- und Problem-Management, Krisen- und Notfallmanagement sowie mit externen Dienstleistern und dem höheren Management.

Das Ergebnis

Das Projekt schuf erstmals vollständige Transparenz über die tatsächliche Wiederherstellungsfähigkeit der virtualisierten Netzwerklandschaft. Damit wurde nicht nur erkennbar, welche Systeme grundsätzlich wiederhergestellt werden konnten. Das Projekt machte auch die technischen Grenzen und die den Wiederanlauf kritischer Netzwerkfunktionen beeinflussenden Abhängigkeiten deutlich.

Ein wesentliches Ergebnis war die Integration von 30 der 40 kritischen Systeme in den Cyber Recovery Vault. Für diese Systeme konnte erstmals nachgewiesen werden, dass eine Wiederherstellung nach Cyberangriffen möglich ist. Somit blieb die Bewertung nicht auf Konzepte und Annahmen beschränkt, sondern wurde durch Recovery-Tests und Dry Runs praktisch überprüft. Zu diesem Zweck wurden neue Recovery- und Testprozesse eingeführt.

Gleichzeitig machte das Projekt deutlich, dass das ursprünglich definierte Wiederherstellungsziel unter den bestehenden technischen und organisatorischen Rahmenbedingungen nicht erreichbar war. Diese Erkenntnis war für die weitere Steuerung von zentraler Bedeutung, da sie die Lücke zwischen Zielvorgabe und tatsächlicher Wiederherstellungsfähigkeit belegte.

Die Ursachen dafür lagen nicht in einem einzelnen System oder einer isolierten Schwachstelle. Die Analyse zeigte mehrere strukturelle Hürden: Legacy-Systeme mit langen Recovery-Zeiten, Systeme ohne Integrationsmöglichkeit in den Cyber Recovery Vault, unzureichende Backup-/Restore-Architekturen, Kapazitäts- und Designgrenzen des Vaults, komplexe Wiederherstellungsabhängigkeiten sowie organisatorische Einschränkungen.

Durch die strukturierte Analyse, die Eskalation kritischer Risiken und die Aufbereitung für das Management entstand eine fundierte Entscheidungsgrundlage für Folgeinvestitionen und langfristige Resilienzmaßnahmen. Damit leistete das Projekt einen Beitrag zur Erhöhung der Cyber-Resilienz und zur regulatorischen Absicherung geschäftskritischer Telekommunikationsdienste.

Kontakt

Sie suchen einen erfahrenen und zuverlässigen IT-Partner?

Wir bieten Ihnen individuelle Lösungen für Ihre Anliegen – von Beratung, über Entwicklung, Integration, bis hin zum Betrieb.

Jetzt kontaktieren