Antonio Arlley Oliveira
Analista de Infraestrutura Pleno • Monitoramento • AWS/Azure
Profissional de TI com 10+ anos de experiência, sendo 8 anos especializado em Observabilidade e Monitoramento de infraestrutura em larga escala. Domínio em Zabbix, Grafana, Splunk, Datadog, Nagios, SolarWinds, N8N e Docker, com atuação em ambientes Linux/Windows e Cloud (AWS e Microsoft Azure e Google Cloud).
Sobre mim
Profissional com 10 anos de experiência em infraestrutura, especializado em monitoramento de redes, conectividade e negócios. Responsável pela gestão de mais de 10.000 hosts e redes de 1.246 lojas, utilizando ferramentas como Zabbix, Icinga2, Grafana, SolarWinds e Splunk.
Atuo na criação de integrações via APIs e automação de alertas e acionamentos, otimizando a operação e a resolução de incidentes. Estou me especializando em AWS, Microsoft Azure, Terraform, Ansible e CI/CD para apoiar a migração e modernização de ambientes on-premises para a nuvem. Além disso, sou certificado AWS, Azure, FinOps e ITIL.
Atuação atual (Monitoramento & Observabilidade)
- Criação e administração de monitorias de infraestrutura e processos de negócio, garantindo disponibilidade e desempenho de sistemas críticos.
- Operação e evolução de stacks com Zabbix, Icinga/Icinga2, SolarWinds, Grafana e Splunk.
- Desenvolvimento de plugins em Python para ampliar coleta de métricas, normalizar dados e reduzir gaps de visibilidade.
- Integrações via APIs e automações de alertas/acionamentos para reduzir tempo de resposta e padronizar atendimento de incidentes.
- Criação e manutenção de dashboards no Grafana com versionamento em GitLab (histórico, revisão e reaproveitamento).
- Personalização e otimização contínua do monitoramento (ajuste de thresholds, redução de ruído e melhoria de sinal).
- Automação com n8n para orquestrar integrações e provisionar monitorias via APIs, acelerando cadastros e padronizando entregas.
Competências Técnicas
Experiência Profissional
- Responsável por monitoramento e observabilidade de infraestrutura e negócios, com foco em disponibilidade e performance.
- Gestão de ambiente em escala (mais de 10.000 hosts e rede de 1.246 lojas).
- Integrações e automações para alertas/acionamentos, melhorando o fluxo de incidentes e a operação.
Experiências anteriores
- DigiSystem — Analista de Monitoramento Jr 05/07/2017 — 01/06/2019
Monitoramento e suporte de ambientes e serviços. Atuação com ferramentas de monitoramento e alertas. - DigiSystem — Analista de Service Desk 05/07/2017 — 01/03/2019
Atendimento N1 e suporte aos usuários. - Enigma — Analista de Service Desk 17/01/2016 — 10/10/2016
Suporte e atendimento de TI. - Computécnica Informática — Estágio em TI 08/07/2015 — 16/01/2016
Atividades voltadas à área de TI.
Certificações
- AZ-900: Microsoft Azure Fundamentals — 06/2022
- AWS Certified Cloud Practitioner — 28/01/2023
- FinOps Certified Practitioner — 08/05/2024
- ITIL® Foundation V3
- IT Service Management Foundation ISO / IEC 20000
- Scrum Fundamentals Certified
Formação Acadêmica
Especialização focada em fundamentos e práticas de cloud.
Formação superior.
Incidentes, alertas e notificações
- Abertura automática de incidentes no Zendesk via alertas do Zabbix.
- Acionamento automático via Splunk (VictorOps) usando Zabbix, Icinga2, SolarWinds e Zendesk.
- Notificações automáticas do Zabbix no Slack, Google Chat e e-mail.
- Script via API do Zabbix para contabilizar hosts e triggers ativos.
- Monitoramento: sites/SSL/domínios, pedidos na loja, ODBC e HTTP agent.
- Scripts para processos SQL, MongoDB, InfluxDB, Oracle e SEFAZ.
- Scripts consumindo dados de Prometheus, New Relic, Graylog, Elasticsearch, Stackdriver e Step.
Dashboards e integrações via APIs
- SolarWinds → Data Studio (dashboards de métricas).
- APIs Icinga2 (Nagios) e Zabbix → Data Studio.
- Integração do Grafana com ferramentas de monitoramento e bancos para dashboards personalizados.
Projetos & Automações
Acionamento Automático de Alertas via WhatsApp e Ligação
Fluxo completo: Zabbix → n8n → WhatsApp + Twilio + ACK automático. Incidentes registrados no Postgres. 100% em produção.
Auto-Remediation de Serviços
Zabbix detecta serviço inativo via TCP check → aciona n8n via webhook → n8n acessa host por SSH e reinicia o serviço automaticamente. MTTR <30s, zero intervenção manual.
ChatBot de Plantão
Bot no WhatsApp integrado ao Zabbix via n8n: responde “status”, “alertas” e “sla” em tempo real, sem abrir nenhuma ferramenta de monitoramento.