Grafana + Prometheus: setup completo para produção em 2026
Tutorial completo para implementar Grafana e Prometheus em produção. Docker Compose, alertas, dashboards, Loki para logs e Tempo para traces.
Grafana e Prometheus são o par mais popular de observabilidade open-source no mercado. Juntos, oferecem métricas, alertas e dashboards de nível enterprise — sem custo de licenciamento.
Este guia entrega um setup production-ready que você pode implementar hoje.
Arquitetura do stack completo
```
┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ Aplicações │────▶│ Prometheus │────▶│ Grafana │
│ + Exporters │ │ (Métricas) │ │ (Dashboards) │
└──────────────┘ └──────────────┘ └──────────────┘
│ ▲
│ ┌──────────────┐ │
└─────────────▶│ Loki │────────────┘
│ │ (Logs) │
│ └──────────────┘
│ ┌──────────────┐
└─────────────▶│ Tempo │────────────┘
│ (Traces) │
└──────────────┘
```
Setup com Docker Compose
```yaml
# docker-compose.yml
version: "3.9"
services:
prometheus:
image: prom/prometheus:v2.50.0
container_name: prometheus
restart: unless-stopped
ports:
volumes:
command:
grafana:
image: grafana/grafana:10.4.0
container_name: grafana
restart: unless-stopped
ports:
environment:
GF_SECURITY_ADMIN_PASSWORD: "change-me-in-production"
GF_INSTALL_PLUGINS: grafana-clock-panel,grafana-piechart-panel
volumes:
loki:
image: grafana/loki:2.9.0
container_name: loki
restart: unless-stopped
ports:
volumes:
alertmanager:
image: prom/alertmanager:v0.27.0
container_name: alertmanager
restart: unless-stopped
ports:
volumes:
node-exporter:
image: prom/node-exporter:v1.7.0
container_name: node-exporter
restart: unless-stopped
ports:
command:
volumes:
volumes:
prometheus-data:
grafana-data:
loki-data:
```
Configuração do Prometheus
```yaml
# config/prometheus.yml
global:
scrape_interval: 15s
evaluation_interval: 15s
rule_files:
alerting:
alertmanagers:
scrape_configs:
static_configs:
static_configs:
metrics_path: "/metrics"
static_configs:
```
Alertas essenciais
```yaml
# config/alerts.yml
groups:
rules:
expr: 100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 85
for: 5m
labels:
severity: warning
annotations:
summary: "CPU acima de 85% por 5 minutos"
expr: (node_filesystem_avail_bytes / node_filesystem_size_bytes) * 100 < 15
for: 10m
labels:
severity: critical
annotations:
summary: "Disco com menos de 15% livre"
expr: (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100 > 90
for: 5m
labels:
severity: critical
annotations:
summary: "Memória acima de 90%"
```
Dashboards recomendados
Importe estes dashboards do Grafana.com:
Boas práticas para produção
1. Retenção: 30 dias no Prometheus, long-term no Mimir ou Thanos
2. Alta disponibilidade: 2 instâncias Prometheus com dedup no Grafana
3. Segurança: Grafana atrás de reverse proxy com TLS + autenticação OIDC
4. Backup: snapshots do volume Prometheus e Grafana database
5. Recording rules: pré-calcular queries pesadas para dashboards mais rápidos
Próximos passos
Agende uma call gratuita e nossa equipe implementa o stack de observabilidade completo no seu ambiente. [Fale com um especialista →](/contato)
Observabilidade open-source com Grafana e Prometheus entrega o mesmo nível de visibilidade que soluções pagas — com controle total sobre seus dados.
Precisa de ajuda com Observabilidade?
Consultoria especializada com resultados mensuraveis. Fale com um especialista sem compromisso.
Artigos relacionados
Por que empresas brasileiras precisam de consultoria de TI com profundidade técnica real
Com 15+ anos em infraestrutura crítica, Cloud Azure/AWS, FinOps e Agentes de IA, a SENTINEL Tecnologia entrega resultados mensuráveis.
FinOpsFinOps na prática: como reduzimos até 30% dos custos de nuvem sem comprometer performance
Estudo de caso real: cliente reduziu R$ 47.000/mês no Azure com rightsizing. Metodologia FinOps da SENTINEL.