Anunciado como uma das maiores novidades do Microsof Build 2025, principal evento de tecnologia da empresa. Construído para usar recursos de IA juntamente com LLM, o objetivo do Azure SRE Agent é trazer respostas ágeis e proativas para manutenção de ambientes cloud. Apoiando na resposta de incidentes, a ferramenta tem como premissa reduzir a carga de trabalho de gerenciamento de ambientes cloud produtivos.
Usando LLMs para analisar os logs e métricas para uma análise efetiva e rápida da causa raiz de um problema e sua solução. Em cenários de crescimento da complexidade de ambientes clouds, o correto uso da engenharia de confiabilidade do site, SRE, apresenta-se como uma prioridade para os times responsáveis por manter funcionais, efetivos e confiáveis ambientes cloud em produção.
Integrado aos recursos de observabilidade e gerenciamento de incidentes como o Agentic DevOps no GitHub Copilot de forma que ele possa monitorar e aprender a integridade dos recursos, lidando com alertas de forma a resolver problemas mais rapidamente.
Principais Recursos
Com o objetivo de ajudar a tornar o ambiente mais confiável, escalável e seguro, o Azure SRE Agent conta com os seguintes recursos.:
✔ Avaliando tendências de uso e desempenho.: avaliando o ambiente de forma contínua, executando em segundo plano 24 horas por dia, 7 dias por semana, o SRE Agent auxilia os times através de respostas a perguntas via prompt para identificação rápida de inconsistências.
✔ Detecção e correção proativas de vulnerabilidades de Segurança.: Fazendo auditorias frequentes, o SRE Agent verifica uso de versões TLS com suporte por exemplo, assim como executar as operações necessárias para atualizar os recursos com sua aprovação para deixar os mesmos em conformidade.
✔ Resposta automatizada a incidentes e análise mais rápida da causa raiz.: Executando em conjunto com o Azure Monitor e o PagerDuty por exemplo, o SRE Agent pode atuar na resposta a incidentes, reduzindo o tempo de resposta e auxiliando os times na resolução de incidentes em um tempo menor que os métodos tradicionais.
✔ Mitigação de Incidentes.: Para normalizar uma aplicação ao seu estado operacional, o SRE Agent pode fazer ações em nome e com aprovação do usuário. Essas açoes podem ser escalar recursos, reiniciar aplicativos e executar rollbacks de aplicativo de forma normalizar uma aplicação de forma mais rápida possível.
✔ Feche o ciclo com os desenvolvedores.: Após a finalização da investigação, o SRE Agent cria um problema no GitHub, gerando os detalhes da investigação, ajudando os desenvolvedores a corrigir o código-fonte e evitar recorrências subsequentes de um incidente.
O Azure SRE Agent é um dos recursos novos mais aguardados para estarem disponíveis no Azure para os próximos meses para apoiar os times na gestão de ambientes cloud produtivos e complexos.
Referências.:
https://learn.microsoft.com/pt-br/azure/app-service/sre-agent-overview
https://azure.microsoft.com/en-us/blog/all-the-azure-news-you-dont-want-to-miss-from-microsoft-build-2025/
https://build.microsoft.com/en-US/sessions/DEM550
https://techcommunity.microsoft.com/blog/azurepaasblog/introducing-azure-sre-agent/4414569
Top comments (0)