Monitoring dei servizi #4

Open
opened 2021-08-31 10:02:31 +00:00 by giomba · 3 comments
Owner

Serve un software automatico che controlli periodicamente lo stato dei vari servizi e mandi un'email al sysop se qualcosa non sta funzionando.

Possiamo partire col monitorare gli endpoint HTTP.

Serve un software automatico che controlli periodicamente lo stato dei vari servizi e mandi un'email al sysop se qualcosa non sta funzionando. Possiamo partire col monitorare gli endpoint HTTP.
Owner

Mi insegnate che ce ne sono a bizzeffe (nagios?).
Ma come diceva Toto': chi controlla il controllore?

Mi insegnate che ce ne sono a bizzeffe (nagios?). Ma come diceva Toto': chi controlla il controllore?
Author
Owner

Toccherà mettersi a studiare anche questa. D:

Il controllore lo controlla il primo che si pone la domanda, che in questo caso sei te :-)

Scherzi a parte: metteremo almeno la mia email.

Toccherà mettersi a studiare anche questa. D: Il controllore lo controlla il primo che si pone la domanda, che in questo caso sei te :-) Scherzi a parte: metteremo *almeno* la mia email.
Member

Quello che faccio per i miei servizi è usare uptime kuma, con

  • un "ping" attivo (a seconda del servizio da monitorare tramite: get http, tcp verso la porta ssh, query dns, ping verso un IP in LAN)
  • un ping passivo, con uno script che direttamente sulla macchina monitora delle risorse (spazio, stato delle pool e snaphots ZFS...), esempio, monitoraggio spazio sul server

File docker compose da me attualmente in uso, definisce un networks.proxy per l'accesso da parte di traefik (compose)

In aggiunta, dato che uptime kuma risiede sul server, monitoro lo stesso tramite il tier gratuito di healthchecks.io, inviando un "ping" tramite lo script di healthcheck linkato sopra

Quello che faccio per i miei servizi è usare [uptime kuma](https://uptime.kuma.pet/), con - un "ping" attivo (a seconda del servizio da monitorare tramite: get http, tcp verso la porta ssh, query dns, ping verso un IP in LAN) - un ping passivo, con uno script che direttamente sulla macchina monitora delle risorse (spazio, stato delle pool e snaphots ZFS...), [esempio, monitoraggio spazio sul server](https://git.golem.linux.it/lanquil/shareable-drafts/src/commit/cd5455b9d82f52e7c688cae3655cc9c027f48338/healthcheck) [File docker compose da me attualmente in uso](https://git.golem.linux.it/lanquil/shareable-drafts/src/commit/cd5455b9d82f52e7c688cae3655cc9c027f48338/uptimekuma/docker-compose.yaml), definisce un `networks.proxy` per l'accesso da parte di traefik ([compose](https://git.golem.linux.it/lanquil/shareable-drafts/src/commit/cd5455b9d82f52e7c688cae3655cc9c027f48338/traefik/docker-compose.yaml)) In aggiunta, dato che uptime kuma risiede sul server, monitoro lo stesso tramite il tier gratuito di [healthchecks.io](https://healthchecks.io/), inviando un "ping" tramite lo script di healthcheck linkato sopra
Sign in to join this conversation.
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: golem/morgan#4
No description provided.