Die Elemente der Business Continuity-Planung

Die Wiederherstellung nach einem Business Continuity-Ereignis (BCE) erfordert eine systemweise Planung mit einem gründlichen Verständnis der Auswirkungen der einzelnen Computer- und Netzwerkkomponenten auf kritische Geschäftsergebnisse. Folglich muss die Business Continuity Planning (BCP) mehrere dokumentierte, getestete und praktizierte Aufgaben umfassen, die Folgendes unterstützen:

  • Systemabhängigkeitszuordnung
  • Maximal tolerierbare Störungszeiten (MTPOD)
  • Mittlere Reparaturzeit (MTTR)
  • Wiederherstellungszeitziele (RTO)

Eine falsche Analyse eines oder mehrerer dieser BCP-Ziele führt wahrscheinlich zu irreparablen Schäden für Ihr Unternehmen, wenn ein kritischer Geschäftsprozess fehlschlägt.

Systemabhängigkeitszuordnung

Ein System steht selten allein; Die meisten Systeme sind Teil einer Reihe technischer Komponenten, die einen oder mehrere Geschäftsprozesse unterstützen. Sie wirken wie eine interne IT-Lieferkette. Abbildung A zeigt eine Reihe von Systemen (S n ), die die Auftragserfassung (S1), die Auftragsabwicklung (S2), die Rechnungsstellung (S3) und den Versand (S4) bereitstellen. Bestellungen, die in S1 eingegeben werden, werden durch S2 abgeschlossen. S2 speist dann S3 dort ein, wo die Rechnungsstellung erfolgt, und Lagerauswahlkarten werden von S4 generiert. Jedes System muss die erwartete Leistung erbringen, um das vom Kunden erwartete Ergebnis zu erzielen: Lieferung des Produkts wie versprochen. Folglich besteht der erste Schritt in BCP für einen kritischen Prozess darin, alle unterstützenden Systeme zu verstehen.

Abbildung A.

Interne Systemversorgungskette

Aufgrund der Platzbeschränkungen eines Blog-Artikels habe ich keine Netzwerkkomponenten in diese Grafik aufgenommen. Zwischen jedem der Systeme befinden sich jedoch Kabel, Switches, Router, IPS / IDS usw. Darüber hinaus sind Cloud-Services, die ein vollständiges System oder eine Systemkomponente bereitstellen, wichtige Elemente Ihrer internen IT-Lieferkette. Nehmen Sie alle Netzwerk- und Cloud-Services in Ihre Supply-Chain-Grafik auf. Ihre Grafik wird wahrscheinlich viel größer sein als meine.

Maximal tolerierbare Störungsdauer

MTPOD, manchmal auch als maximal tolerierbare Ausfallzeit bezeichnet, ist die Gesamtzeit, die ein Geschäftsprozess außer Betrieb sein kann, bevor ein Unternehmen irreparablen Schaden erleidet. MTPOD enthält die aggregierte MTTR und die Prozesszykluszeit. Die Zykluszeit stellt den Zeitraum dar, der erforderlich ist, um eine einzelne Iteration des betroffenen Geschäftsprozesses ab dem Zeitpunkt des Ausfalls abzuschließen. Wenn beispielsweise S3 (Abbildung A) fehlschlägt, ist die Zykluszeit der Zeitraum, der erforderlich ist, um alle Eingaben von S2 zu verarbeiten und das Produkt zu versenden.

Mittlere Reparaturzeit

Während sich MTPOD auf den betroffenen Prozess bezieht, gilt MTTR für einzelne Komponenten (System- und Netzwerkgeräte). Dies ist die durchschnittliche Zeit, die erforderlich ist, um einen fehlgeschlagenen Schritt in einem Prozess in den normalen Betrieb zurückzusetzen. Die aggregierte MTTR ist die durchschnittliche Zeit, die erforderlich ist, um alle ausgefallenen Systeme oder Komponenten während eines weit verbreiteten Geschäftskontinuitätsereignisses wiederherzustellen. MTTR wird von vielen Variablen beeinflusst, darunter:

  • Die Art des Fehlers . Ein Kabelfehler ist viel einfacher zu reparieren als ein Stromversorgungsfehler.
  • Verfügbarkeit von Ersatzteilen . Viele Unternehmen halten Ersatzteile für kritische Komponenten bereit, einschließlich Verkabelung. Wenn Teile von Lieferanten bestellt oder installiert werden müssen, sind Vorlaufzeiten, Fahrzeiten usw. ein notwendiger Bestandteil von MTTR.
  • Interne Überwachungsfunktionen und Fähigkeiten . Wie lange dauert es, bis ein IT-Team einen Fehler identifiziert und seine Grundursache ermittelt hat? Die ordnungsgemäße Schulung des Personals und die Wartung der aktuellen System- und Netzwerkdokumentation unterstützen diese Bemühungen entscheidend.
  • Verfügbarkeit der wichtigsten internen Person l. Tageszeit, Benachrichtigungsprozesse und ordnungsgemäße Freizeitverwaltung wirken sich auf die Ankunft von Mitarbeitern aus, die für die Verwaltung eines Geschäftskontinuitätsereignisses erforderlich sind.
  • Wartung an Ort und Stelle . Die Zeit, die für die Reaktion des Lieferanten und die Lieferung von Ersatzteilen benötigt wird, wird direkt von formellen Vereinbarungen und SLAs beeinflusst.
  • Die Wirksamkeit von BCP, einschließlich Disaster Recovery.

Jede Komponente verfügt über eine für Ihre Organisation eindeutige MTTR. Das Anpassen von SLAs, das Dokumentieren und Üben der Reaktion auf Vorfälle und das Sicherstellen, dass Schlüsselpersonal auf Abruf ist, sind Beispiele für Bedingungen, die die MTTR verkürzen können.

Ziel der Wiederherstellungszeit

Die RTO ist der Punkt, an dem ausgefallene Geräte angesichts der Prozesszykluszeit betriebsbereit sein müssen (siehe Abbildung B. ). Die aggregierte MTTR kann die RTO nicht überschreiten. In diesem Fall erstreckt sich die Zeit zum Erstellen der erforderlichen Ausgabe über den MTPOD hinaus. Disaster Recovery-Übungen sind ein gutes Beispiel für das Testen von RTO. Wenn der Prozesswiederherstellungszeitraum über die RTO hinausgeht, sind MTTR-Anpassungen für eine oder mehrere wiederhergestellte Prozesskomponenten erforderlich.

Abbildung B.

Cloud-Dienste wirken sich auf MTPOD aus

Die Steuerung der Business Continuity-Ereignisplanung ist relativ einfach, wenn sich alle Komponenten im eigenen Rechenzentrum eines Unternehmens befinden. Es können jedoch Schwierigkeiten auftreten, wenn bei der Auswahl der Cloud-Dienstanbieter und den Vertragsverhandlungen keine Due Diligence durchgeführt wird. Abbildung C zeigt, wie unser Beispielprozess aussehen könnte, wenn die Auftragserfassung zu einem Anbieter verschoben wird. Die Organisation hat keine direkte Kontrolle mehr über die Infrastruktur, Plattformen oder Software, die zur Aufrechterhaltung der Prozesskontinuität erforderlich sind.

Abbildung C.

Das Verschieben eines oder mehrerer Systeme in die Cloud bietet einen wesentlichen Vorteil für das Unternehmen: Eindämmung katastrophaler Ereigniseffekte. Zum Beispiel erfordert der Verlust des Rechenzentrums dieser Organisation die Wiederherstellung von S2, S3 und S4. Die einzige Wiederherstellungsaktivität für S1 ist jedoch die Wiederherstellung der Konnektivität zu S2. Dies erleichtert das Erreichen der definierten RTO erheblich.

Probleme können auftreten, wenn der Fehler beim Anbieter auftritt. SLAs, Sanktionen, Kundenaudits und vertragliche Verpflichtungen steuern und überwachen in unserem Beispiel die MTTR für S1. Der Ruf des Anbieters, der durch Gespräche mit bestehenden Kunden gestützt wird, ist ein gutes Maß für die Bereitschaft und Fähigkeit des Anbieters, sich innerhalb der erwarteten MTTR zu erholen. In jedem Fall ist ein Anbieter, der innerhalb von RTOs keine Wiederherstellung für betroffene Geschäftsprozesse durchführen kann, wahrscheinlich nicht die richtige Lösung für Ihr Unternehmen.

Das letzte Wort

Die Wiederherstellung nach Business Continuity-Ereignissen, dh Situationen, in denen Geschäftsprozesse fehlschlagen, erfordert die genaue Beachtung von MTPOD. Durch Anpassen der MTTR für alle System- und Netzwerkkomponenten wird das RTO-Element von MTPOD erreicht. Es beruht auf mehreren Faktoren, einschließlich der schnellen Erkennung von Grundursachen sowie der Verfügbarkeit und Fähigkeit des Wiederherstellungspersonals.

Die Zykluszeit ist ein weiterer entscheidender Faktor bei der Berechnung des MTPOD. Der Zeitraum, der erforderlich ist, um die ersten Ergebnisse zu erzielen, darf nach Wiederherstellung eines Prozesses durch die Teams den verbleibenden Zeitraum zwischen der RTO und dem MTPOD-Endpunkt nicht überschreiten. Wenn dies der Fall ist, besteht die wahrscheinliche Lösung in Anpassungen der aggregierten MTTR.

Das Verschieben einer oder mehrerer Prozesskomponenten in die Cloud kann dazu beitragen, die Gesamt-MTTR zu reduzieren, wenn ein katastrophales Ereignis eintritt. Der richtige Anbieter, der von einer fairen, aber aggressiven Kundenüberwachung der SLAs und vertraglichen Anforderungen geleitet wird, kann die Wiederherstellung erleichtern. Der falsche Anbieter kann MTTR für Cloud-gehostete Komponenten über RTOs hinaus steuern. Wählen Sie mit Bedacht aus.

© Copyright 2020 | mobilegn.com