Zuverlässige Überwachung der Zuverlässigkeit mit Cacti und Monitor.Us

Wenn mein Service nicht zuverlässig ist, ist er nicht betriebsbereit. Ich möchte vorhersagen, wie zuverlässig mein neuer Dienst sein wird, wenn er betriebsbereit ist. Ich möchte kein Geld ausgeben. Wie mache ich es?

Zuverlässigkeitsanforderungen

Ich habe ein paar einfache funktionale Anforderungen zusammengestellt, um sie zu testen.

  • Zeigen Sie die Startseite innerhalb von 5 Sekunden an.
  • Halten Sie diese lästige Aufgabe 1 Woche lang aufrecht.
  • Beschäftige dich mit jeweils einem Benutzer.

Offensichtlich ist das ein bisschen lächerlich. Eine einseitige Website, die sich jeweils mit einem Kunden befasst, kann mit einem Blatt Papier und einer Packung Buntstifte betrieben werden. Eine echte Beschreibung der Zuverlässigkeitsanforderungen für ein Unternehmen erstreckt sich über viele Seiten.

Ich muss eine Betriebsumgebung vortäuschen und sehen, was passiert. Ich leite meinen Produktionsservice eine Woche lang, sammle einige Zahlen zu Leistung und Ausfall und vergleiche diese Messungen mit den Anforderungen.

Vorhersage der Zuverlässigkeit vor dem Betrieb

Ich benötige ein Überwachungs- und Warnsystem, das meinen Dienst überwacht.

  • von innen die Komponenten beobachten und
  • von außen prüfen, was ein Kunde sehen würde.

Um mein System von innen zu betrachten, verwende ich die Open-Source-Anwendung Cacti, da sie kostenlos ist und mein Projektbudget Null beträgt. Ich könnte die grundlegenden CloudWatch-Metriken verwenden, die AWS mit meinem EC2-Computer bündelt. Ich bekomme diese kostenlos.

Abbildung A.

Das ist in Ordnung, aber ich bin mit dem Detaillierungsgrad nicht ganz zufrieden. Ich könnte eine detaillierte Überwachung gegen eine geringe Gebühr aktivieren, muss dies aber nicht.

Um mein System von außen zu beobachten, verwende ich den Cloud-basierten Überwachungsdienst Monitor.Us.

Mit Kakteen das Innere beobachten

Cacti ist eine Open Source-Anwendung, die mir den Verlauf der Ressourcenauslastung meines Systems anzeigen kann. Es werden Diagramme der Systemaktivität erstellt - CPU, Netzwerknutzung, Anzahl der angemeldeten Benutzer usw. Diese Grafiken zeigen mir, was in den letzten fünf Minuten, den letzten Stunden, der Woche und sogar im Jahr passiert ist. Eine einfache Installation von Kakteen behält nur die EC2-Maschine im Auge, auf der sie installiert ist, kann aber auch Hunderte anderer Maschinen beobachten.

Abbildung B.

Ich folge diesem Verfahren, um mein System von innen zu beobachten.

  • Installieren Sie Kakteen, um Leistungsdiagramme zu erstellen.
  • Erweitern Sie die Überwachung von Kakteen auf alle meine EC2-Maschinen.
  • Lassen Sie den neuen Dienst etwas tun, indem Sie Personen oder einen Generator für synthetische Lasten testen.
  • Sammeln Sie eine Woche lang Grafiken.

Ich habe jetzt meine erste Ansicht darüber, ob eine Komponente wahrscheinlich ausfällt. Wenn ich bereits Probleme habe, werde ich wahrscheinlich ein inakzeptables Maß an Fehlern haben.

Die Installation von Cacti ist ärgerlich, so wie es nur Open Source-Produkte können. Sicherlich würde es als Closed-Source-Produkt nicht überleben: Kein zahlender Kunde würde gutes Geld ausgeben, um stundenlang mit der Konfiguration herumzuspielen. Alles beginnt so einfach mit sudo yum install cacti, geht dann schnell in die SNMP-Konfiguration über und es fehlt die Verwirrung der Grafiken. Ich bewundere den idealistischen Anwalt Professor Eben Moglen, der sagte, proprietäre Software sei genauso lächerlich wie proprietäre Mathematik (obwohl ich das auf Wikipedia gelesen habe, also hat er vielleicht tatsächlich gesagt "Mathematik ist richtig lächerlich"), und selbst ich freue mich nicht auf die Installation Kakteen. Sobald es die Schmerzgrenze überschritten hat, ist es ein hervorragendes Produkt, das viele leicht lesbare Zusammenfassungsdiagramme für Zeiträume von 5 Minuten bis zu 1 Jahr enthält.

(Wenn Sie möchten, dass die Kakteen Spickzettel installieren, sagen Sie bitte.)

Mit Monitor.Us nach außen schauen

Ich muss die Antwortzeit über das Internet überprüfen und sicherstellen, dass das System meinen Anforderungen entspricht. Ich kann in meinen Ergebnissen nach einem Muster suchen, um die Konsistenz meines Dienstes herauszufinden.

Monitor.Us folgt dem Freemium-Marketingmodell. Wie AWS Cloudwatch bietet Monitor.Us die Grundlagen kostenlos an, wodurch die Aufmerksamkeit von billigen Skates wie mir auf sich gezogen wird, und berechnet die Kosten für das clevere Zeug. Ich kann kostenlos einen regelmäßigen HTTP-Check von www.internetmachines.co.uk und ein Antwortzeitdiagramm für den aktuellen Tag erhalten (ich möchte tatsächlich eine Woche mit Diagrammen, was bedeutet, dass ich entweder eine Woche lang genau aufpassen muss oder ein wenig Geld bezahlen).

Abbildung C.

Der Monitor.Us-Dienst kann als Betriebsmonitor fungieren, der eine weitere meiner Anforderungen an die Betriebsbereitschaft erfüllt.

Zuverlässigkeit während des Betriebs messen

Ein permanenter Zuverlässigkeitsmonitor gibt dem Schmerz des Versagens Zahlen. Während der Lebensdauer meines Systems kann ich dessen Leistung aufzeichnen und meine Daten auswerten. Cacti wird mir schließlich eine Grafik der Leistung des ganzen Jahres zeigen.

Je mehr Daten ich habe, desto besser ist theoretisch mein Bild von seiner Zuverlässigkeit, sodass ich meine Vorhersagen mit historischen Daten verbessern kann. In der Praxis muss ich vorsichtig sein. Es ist nur eine kleine Änderung der Infrastruktur erforderlich, um den Wert meiner Messungen zu entfernen. Nur weil mein Service jahrelang auf IBM Blades gut funktioniert hat, heißt das nicht, dass er auf EC2-VMs gut funktioniert.

© Copyright 2020 | mobilegn.com