Kapitel 15/Premium Rohtext.md hinzugefügt

2025-10-18 13:51:15 +00:00
parent 57b3395f85
commit d336e13525
1 changed files with 350 additions and 0 deletions
--- a/Rohtext.md
+++ b/Rohtext.md
@@ -0,0 +1,350 @@
+# Premium – Netdata: Automatisierung, Alarmierung & Benutzerverwaltung
+
+Netdata ist im UCC weit mehr als ein reines Monitoring-Werkzeug.  
+Im Free-Kapitel wurde die Grundlage gelegt – ein zentraler Container mit Echtzeit-Dashboard und Streaming-Verbindungen zu allen LXC-Systemen.  
+Dieser Premium-Teil erweitert die Installation zu einem **aktiven Kontrollsystem**, das Zustände nicht nur überwacht,  
+sondern automatisch auf Fehler, Engpässe oder Ausfälle reagiert.
+
+Ziel ist ein **intelligentes Monitoring-Cluster**, das Warnmeldungen generiert, Log-Daten auswertet und über **n8n-Workflows** Aktionen auslöst –  
+etwa Neustarts, Benachrichtigungen per Mail oder Discord, oder das Sperren fehlerhafter Container.  
+Zusätzlich lernst du, wie du im Netdata-Dashboard **Benutzerkonten und Rollen** anlegst, um den Zugriff im Team klar zu regeln.
+
+👉 **Screenshot geeignet:** Architekturdiagramm mit Datenfluss zwischen Netdata (Parent), n8n und den überwachten LXC-Containern
+
+> [!NOTE]  
+> Dieses Kapitel baut auf einer vollständig funktionierenden Free-Installation auf.  
+> Stelle sicher, dass dein zentraler Netdata-Container läuft und bereits mit allen relevanten LXC-Containern verbunden ist.
+
+Im Ergebnis entsteht ein automatisiertes Frühwarnsystem, das Probleme erkennt, bevor sie kritisch werden –  
+ideal für Content-Creator, Streamer und kleine Teams, die ihr Homelab effizient und sicher betreiben möchten.
+
+---
+
+## Benutzer- und Rollenverwaltung
+
+Damit du Netdata sicher auch im Team oder in größeren Setups einsetzen kannst, bietet das Dashboard eine integrierte Benutzerverwaltung.  
+So kannst du den Zugriff gezielt einschränken, bestimmte Ansichten freigeben oder administrativen Zugriff trennen.
+
+👉 **Screenshot geeignet:** Netdata-Dashboard mit geöffnetem Einstellungsmenü „User Management“
+
+### Benutzerverwaltung aktivieren
+
+1. Öffne die **Netdata-Weboberfläche** deines zentralen Containers:  
+   ```
+   https://monitor.deinedomain.tld
+   ```
+2. Klicke oben rechts auf das **Benutzersymbol → Settings → User Management**.  
+   Wenn die Benutzerverwaltung noch nicht aktiviert ist, erscheint ein Hinweis, sie zu konfigurieren.
+
+3. Aktiviere **Local User Management**.  
+   Diese Option erlaubt das Anlegen lokaler Benutzer direkt im Container, ohne externe Authentifizierungsquelle.
+
+> [!NOTE]  
+> Eine Integration über externe OAuth- oder LDAP-Server ist ebenfalls möglich,  
+> wird aber nur für größere Teams empfohlen.  
+> Für das Homelab reicht das lokale Benutzerkonzept vollkommen aus.
+
+### Rollen anlegen
+
+Netdata kennt drei Standardrollen, die du individuell anpassen kannst:
+
+| Rolle | Beschreibung |
+|--------|---------------|
+| **Viewer** | Nur lesender Zugriff auf Dashboards und Statistiken. |
+| **Editor** | Zugriff auf Dashboards und Benachrichtigungen, darf jedoch keine Systemeinstellungen ändern. |
+| **Admin** | Vollzugriff auf alle Konfigurationen, Benachrichtigungen und Integrationen. |
+
+Für dein UCC-System empfiehlt sich die folgende Struktur:
+
+- **viewer** → allgemeiner Zugriff, z. B. zur Kontrolle von Systemauslastung  
+- **editor** → technischer Zugriff für Wartung, aber ohne Konfigurationsrechte  
+- **admin** → nur du bzw. Systembetreuer mit vollem Zugriff  
+
+👉 **Screenshot geeignet:** Rollenübersicht mit markierten Rechten für „viewer“, „editor“ und „admin“
+
+> [!TIP]  
+> Lokale Benutzerkonten werden im Container unter `/var/lib/netdata/registry` verwaltet.  
+> Sichere diesen Ordner regelmäßig, wenn du mehrere Benutzer angelegt hast.
+
+### Zugang für Team-Mitglieder
+
+Neue Benutzer können über die Weboberfläche angelegt oder direkt per CLI erstellt werden:
+
+```bash
+netdata-claim.sh --id <BENUTZERNAME> --role viewer
+```
+
+Anschließend erhält der Benutzer per Browserzugang die entsprechenden Rechte.
+
+> [!NOTE]  
+> Lokale Benutzerkonten sind ausschließlich für den Zugriff auf das Dashboard relevant.  
+> API- oder Alarm-Integrationen laufen weiterhin über dedizierte Tokens,  
+> die im nächsten Abschnitt behandelt werden.
+
+---
+
+## Alarmierung & Ereignisüberwachung
+
+Netdata kann nicht nur messen, sondern aktiv auf Ereignisse reagieren.  
+Durch das integrierte Alarmsystem erkennst du Engpässe, Überlast oder Ausfälle in Echtzeit und wirst automatisch informiert – per E-Mail, Discord oder später über n8n.  
+So reagiert dein System frühzeitig, bevor kleine Probleme zu echten Ausfällen werden.
+
+👉 **Screenshot geeignet:** Netdata-Dashboard mit geöffneter Alarmübersicht (CPU-, RAM- und Disk-Warnungen)
+
+### Grundprinzip
+
+Netdata überwacht hunderte Systemmetriken und prüft sie in kurzen Intervallen gegen definierte Grenzwerte („Health-Rules“).  
+Wenn eine Regel überschritten wird, erzeugt Netdata ein Alarm-Event, das an die hinterlegten Empfänger geschickt wird.  
+Damit das funktioniert, müssen zwei Dinge eingerichtet werden:
+
+1. **Health-Rules** – bestimmen, wann ein Alarm ausgelöst wird  
+2. **Benachrichtigungskanäle** – legen fest, wohin Netdata die Warnung schickt  
+
+### Health-Rules anlegen
+
+Die Standardregeln decken viele Szenarien ab (CPU, RAM, Festplatte, Netzwerk).  
+Für eigene Regeln werden lokale Dateien unter `/etc/netdata/health.d/` verwendet, damit Updates sie nicht überschreiben.
+
+Beispiel:  
+Hohe CPU-Last soll ab 85 % eine Warnung und ab 95 % einen kritischen Alarm erzeugen.
+
+```bash
+mkdir -p /etc/netdata/health.d
+nano /etc/netdata/health.d/system_custom.conf
+```
+
+Inhalt:
+
+```
+alarm: high_cpu_usage
+on: system.cpu
+lookup: average -1m unaligned of user + system
+units: %
+every: 30s
+warn: $this > 85
+crit: $this > 95
+to: sysadmin
+info: CPU usage is too high
+```
+
+Speichern, schließen und Dienst neu starten:
+
+```bash
+systemctl restart netdata
+```
+
+Nach dem Neustart findest du den neuen Eintrag in der Oberfläche unter **Health → Alarms**.  
+Dort kannst du Regeln aktivieren, deaktivieren oder live anpassen.
+
+> [!TIP]  
+> Es ist empfehlenswert, für kritische Komponenten wie Datenbanken, Proxy-Container oder Nextcloud eigene Schwellenwerte zu definieren.  
+> So erkennst du Überlastungen frühzeitig und gezielt.
+
+👉 **Screenshot geeignet:** Dashboard → Health → Alarms (eigene Regel „high_cpu_usage“ sichtbar)
+
+### Benachrichtigungskanäle einrichten
+
+Damit Alarme dich auch erreichen, müssen Kommunikationswege definiert werden.  
+Netdata unterstützt Dutzende Dienste – wir konzentrieren uns auf **E-Mail** und **Discord**, da sie sich leicht in bestehende Systeme einfügen.
+
+#### Konfigurationsdatei öffnen
+
+```bash
+cd /etc/netdata 2>/dev/null || cd /opt/netdata/etc/netdata
+./edit-config health_alarm_notify.conf
+```
+
+Diese Datei enthält alle Benachrichtigungsoptionen.  
+Suche den passenden Abschnitt für deinen Kanal und entferne das führende `#`, um ihn zu aktivieren.
+
+#### E-Mail-Benachrichtigung (optional)
+
+Ein funktionierendes Mailsystem ist in einer frischen Netdata-Installation **nicht vorhanden**.  
+Damit Netdata überhaupt E-Mails versenden kann, musst du zuerst ein leichtgewichtiges SMTP-Tool installieren.  
+Empfohlen wird `msmtp`, weil es einfach zu konfigurieren ist und direkt mit Netdata funktioniert.
+
+##### Schritt 1 – Mailer installieren
+
+```bash
+apt install -y msmtp bsd-mailx
+```
+
+- `msmtp` sendet E-Mails über dein Mailkonto (ähnlich wie ein Mailprogramm)  
+- `bsd-mailx` stellt den Befehl `mail` bereit, den Netdata intern verwendet
+
+##### Schritt 2 – Zugangsdaten einrichten
+
+Erstelle oder bearbeite die Datei `/etc/msmtprc`:
+
+```bash
+nano /etc/msmtprc
+```
+
+Beispielkonfiguration für gängige Mailanbieter (Platzhalter ersetzen):
+
+```
+defaults
+auth on
+tls on
+tls_trust_file /etc/ssl/certs/ca-certificates.crt
+
+account default
+host smtp.mailprovider.tld
+port 587
+from netdata@deinedomain.tld
+user DEIN_LOGINNAME
+password DEIN_PASSWORT
+logfile /var/log/msmtp.log
+```
+
+Speichern, schließen und Berechtigungen anpassen:
+
+```bash
+chmod 600 /etc/msmtprc
+```
+
+##### Schritt 3 – Mailversand testen
+
+Führe einen kurzen Test aus:
+
+```bash
+echo "Testmail vom Netdata-System" | mail -s "Netdata Test" admin@deinedomain.tld
+```
+
+Wenn die E-Mail ankommt, funktioniert der Versand.  
+Erst **jetzt** kann Netdata Mails verschicken.
+
+##### Schritt 4 – Netdata auf E-Mail konfigurieren
+
+Öffne anschließend die Netdata-Konfiguration:
+
+```bash
+cd /etc/netdata
+./edit-config health_alarm_notify.conf
+```
+
+Setze folgende Variablen:
+
+```
+SEND_EMAIL="YES"
+DEFAULT_RECIPIENT_EMAIL="admin@deinedomain.tld"
+```
+
+Speichern, schließen und Netdata neu starten:
+
+```bash
+systemctl restart netdata
+```
+
+👉 **Screenshot geeignet:** Terminal mit erfolgreichem `mail`-Test und sichtbarer Netdata-Mailkonfiguration
+
+> [!TIP]  
+> Wenn du eine dedizierte Mailadresse für Systemmeldungen hast (z. B. `alerts@deinedomain.tld`),  
+> kannst du sie hier direkt als Absender konfigurieren.  
+> Mehrere Empfänger werden durch Kommata getrennt angegeben.
+
+
+#### Discord-Benachrichtigung (empfohlen)
+
+Discord eignet sich hervorragend für schnelle Systemmeldungen – ideal für kleine Teams oder Streamer-Umgebungen.
+
+**1. Webhook im Discord-Server erstellen**
+
+1. Öffne deinen Discord-Server.  
+2. Gehe zu **Servereinstellungen → Integrationen → Webhooks**.  
+3. Klicke auf **Neuer Webhook**.  
+   - Name: `netdata-alerts`  
+   - Kanal: `#alerts` (empfohlen: ein dedizierter Kanal nur für Systemmeldungen)  
+4. Klicke auf **Webhook kopieren**. Diese URL ist dein Zugangs-Token.
+
+> [!IMPORTANT]  
+> Diese Webhook-URL ist vertraulich. Wer sie kennt, kann in deinen Kanal schreiben.  
+> Falls sie kompromittiert wurde, in Discord löschen und neu erstellen.
+
+**2. Webhook in Netdata eintragen**
+
+In der geöffneten Datei `health_alarm_notify.conf` folgende Variablen einfügen (Webhook-URL ersetzen):
+
+```
+SEND_DISCORD="YES"
+DISCORD_WEBHOOK_URL="https://discord.com/api/webhooks/<DEINE_WEBHOOK_ID>/<DEIN_TOKEN>"
+DEFAULT_RECIPIENT_DISCORD="alerts"
+```
+
+Optional kannst du pro Rolle eigene Zielkanäle definieren:
+
+```
+role_recipients_discord[sysadmin]="alerts"
+role_recipients_discord[editor]="operations"
+```
+
+Datei speichern und Netdata neu starten:
+
+```bash
+systemctl restart netdata
+```
+
+**3. Benachrichtigung testen**
+
+Führe einen Testlauf aus, um zu prüfen, ob der Versand funktioniert:
+
+```bash
+sudo su -s /bin/bash netdata
+export NETDATA_ALARM_NOTIFY_DEBUG=1
+/usr/libexec/netdata/plugins.d/alarm-notify.sh test
+```
+
+Wenn alles korrekt eingerichtet ist, erscheint eine Testmeldung im ausgewählten Discord-Kanal.
+
+👉 **Screenshot geeignet:** Discord-Kanal `#alerts` mit Testnachricht „Netdata Notification – This is a test“
+
+> [!TIP]  
+> Kommt keine Nachricht an? Prüfe:
+> - **Webhook-URL** auf Zeilenumbrüche oder Tippfehler  
+> - **Kanalname** ohne `#` in `DEFAULT_RECIPIENT_DISCORD`  
+> - Logausgabe:
+>   ```bash
+>   tail -n 50 /var/log/netdata/error.log
+>   ```
+
+### Alarmkategorien und Schwellenwerte anpassen
+
+Die bestehenden Regeln kannst du jederzeit direkt im Dashboard verändern:
+
+1. **Health → Alarms** öffnen  
+2. Alarm auswählen (z. B. CPU, Disk, Memory)  
+3. Auf **Edit** klicken  
+4. Warn- und Kritisch-Werte anpassen  
+5. Änderungen speichern  
+
+👉 **Screenshot geeignet:** Edit-Fenster eines Alarms mit angepassten Schwellenwerten
+
+Damit du ein Gefühl bekommst, welche Werte sich bewährt haben, findest du hier eine Übersicht typischer Empfehlungen  
+für kleine bis mittlere Homelab-Umgebungen (1–4 vCPUs, 2–8 GB RAM):
+
+| Kategorie | Warnwert | Kritisch | Empfehlung / Hinweis |
+|------------|-----------|----------|------------------------|
+| **CPU-Auslastung** | > 80 % | > 95 % | Dauerhaft hohe Last deutet auf zu wenig Kerne oder hängende Prozesse hin. |
+| **RAM-Auslastung** | > 75 % | > 90 % | Werte oberhalb von 90 % führen oft zu Swap-Nutzung und deutlichen Verzögerungen. |
+| **Swap-Nutzung** | > 10 % | > 25 % | Swap sollte in LXC-Containern nur kurzzeitig genutzt werden. |
+| **Root-Filesystem** | > 85 % | > 95 % | Frühzeitig Speicher erweitern, um Datenbankfehler zu vermeiden. |
+| **Netzwerklatenz (Ping)** | > 50 ms | > 100 ms | Relevant bei externen APIs oder Streaming-Servern. |
+| **Load Average (1 min)** | > 1 × CPU-Kerne | > 2 × CPU-Kerne | Dauerhaft hohe Load-Werte weisen auf Engpässe oder Hintergrundjobs hin. |
+| **Prozessanzahl** | > 300 | > 500 | Nur als Trendindikator – wichtig bei Hosts mit vielen Containern. |
+| **Temperatur (falls Sensoren aktiv)** | > 70 °C | > 85 °C | Besonders bei älteren CPU-Hosts relevant. |
+
+> [!TIP]  
+> Passe die Schwellen so an, dass du bei erwartbarer Last keine Fehlalarme bekommst,  
+> aber ungewöhnliche Zustände früh genug erkennst.  
+> Teste jeden Alarm einmal manuell, um sicherzustellen, dass Benachrichtigungen korrekt ausgelöst werden.
+
+> [!NOTE]  
+> Diese Änderungen gelten sofort und betreffen nur die lokale Instanz.  
+> Sie überschreiben keine globalen Konfigurationsdateien.
+
+👉 **Screenshot geeignet:** Edit-Fenster eines Alarms mit geänderten Schwellenwerten
+
+Damit ist dein System vorbereitet, um Ereignisse automatisch zu erkennen und weiterzugeben.  
+Im nächsten Abschnitt verbinden wir Netdata mit **n8n**, um auf diese Ereignisse gezielt zu reagieren.
+
+