Lar Rever Avaliação e avaliação de pagerduty

Avaliação e avaliação de pagerduty

Vídeo: Take the Lead Jenn Tejada & Stacey Cunningham (Outubro 2024)

Vídeo: Take the Lead Jenn Tejada & Stacey Cunningham (Outubro 2024)
Anonim

O PagerDuty é um serviço de resposta a incidência e alerta que funciona com praticamente qualquer serviço de monitoramento. O serviço pode ser configurado para fornecer alertas por telefone, e-mail, texto ou via aplicativos iOS e Android, com confirmação de entrega e roteamento automático. Um painel mostra incidentes e status de alerta em todas as suas ferramentas de monitoramento. Configurações sofisticadas de agendamento e escalação de alertas mantêm toda a equipe no circuito. As análises avançadas do PagerDuty ajudam a identificar pontos de acesso e tendências de desempenho da equipe.

Estou envolvido com soluções de resposta a incidentes há mais de 20 anos e posso dizer com segurança que o PagerDuty alcança um grande equilíbrio entre facilidade de uso e energia. Admito, estou apaixonada pelo PagerDuty.

Instalação

A inscrição era muito fácil e exigia apenas o meu endereço de e-mail e uma senha. Fui solicitado a enviar um alerta de teste por SMS, telefone e email. Em 10 segundos, recebi os três alertas. O alerta do PagerDuty por SMS solicitou que eu baixasse um aplicativo móvel, enquanto a ligação dizia "oi, esse é um alerta de teste do PagerDuty. Adicione esse número ao seu telefone para garantir que você sempre receba os alertas". Era reconfortante que o sistema de alerta estivesse funcionando.

O próximo passo foi conectar minha ferramenta de monitoramento. Isso pode ser feito simplesmente selecionando minha ferramenta preferida em uma caixa suspensa dos programas suportados, incluindo HP SiteScope, New Relic APM, CopperEgg ou qualquer um dos 50 listados abaixo. Escolhi o CopperEgg porque já havia configurado uma conta para revisar o serviço. Eu também poderia ter optado por enviar email ao PagerDuty para acionar alertas ou conectar-se diretamente à API REST do PagerDuty. Quando cliquei para adicionar o CopperEgg, fui direcionado para uma página da web com informações adicionais sobre a integração. Em seguida, eu precisava gerar e adicionar uma chave de API PagerDuty ao CopperEgg. Em seguida, configurei a escalação de incidentes para que, se não respondesse do primeiro alerta em 10 minutos, o respondedor secundário fosse enviado por email.

Trabalhando com o PagerDuty

Ao entrar no PagerDuty, fiquei impressionado com a aparência direta da interface. A interface do PagerDuty fornece todas as opções de navegação na parte superior da página: painel, incidentes, configuração, análise e ajuda. O painel é aberto por padrão e inclui uma lista dos meus incidentes abertos e de toda a empresa, além de todas as atividades dos últimos sete dias. A tela de incidentes é muito parecida com o painel, mas inclui mais opções para trabalhar com incidentes.

A verdadeira essência do PagerDuty reside no menu de configuração, que inclui opções para agendas, serviços, políticas de escalação, usuários e equipes. A primeira etapa no trabalho com o PagerDuty é criar usuários que serão alertados quando ocorrerem incidentes. Os usuários são atribuídos a uma das quatro funções que variam de limitada, um usuário que só pode acionar, reconhecer e resolver incidentes, a um proprietário de conta que tenha a capacidade de gerenciar qualquer coisa no sistema PagerDuty. Cada usuário recebe regras de notificação atribuídas; eles podem ser alertados sobre incidentes novos ou alterados e quando o período de permanência começa por e-mail, telefone ou SMS. É muito provável que grandes organizações desejem atribuir usuários a equipes para que agendas, notificações e políticas de escalação possam ser gerenciadas com mais facilidade. Por exemplo, uma organização pode ter uma equipe que é notificada por incidentes no servidor e outra equipe que é notificada por incidentes de segurança.

No PagerDuty, como em qualquer sistema de resposta a incidências, o diabo está nos detalhes. O conceito geral é notificar quem precisa saber no momento certo e criar backups para que nada caia nas falhas. Para isso, é necessário prestar muita atenção aos planejamentos e políticas de notificação, em particular às políticas de escalação. O PagerDuty faz um trabalho fantástico de tornar os detalhes fáceis de configurar e gerenciar, e isso se deve principalmente a uma GUI poderosa e fácil de entender. Definir uma programação de plantão exigia pouco mais do que selecionar usuários, escolher um tipo de rotação (diário, semanal ou personalizado) e escolher uma data e hora de início. As agendas de plantão podem ser colocadas em camadas umas sobre as outras, para que você possa ver onde elas se sobrepõem e um calendário aparece na página de gerenciamento de agendas que mostra claramente as agendas e sobreposições de plantão. A política de escalonamento também é muito fácil de configurar e gerenciar devido a uma GUI direta.

Meu primeiro teste do PagerDuty envolveu a abertura manual de um incidente, que aliás é um ótimo recurso para testar como as notificações e as políticas de escalação são configuradas. Em cinco segundos, recebi notificações de incidentes por telefone, SMS e e-mail. A ligação telefônica leu em voz alta para mim o serviço que causou o alerta e algumas informações básicas sobre o alerta, além de me oferecer opções para responder como "pressione 4 para confirmar, 6 para resolver ou pressione 8 para encaminhar". Eu pressionei 4 para confirmar e, seguindo minha política de notificação, fui notificado novamente em meia hora que a condição de alerta ainda existia (as únicas maneiras de interromper as notificações são resolvê-las ou escalá-las). As notificações que recebi por email e SMS foram semelhantes, com o alerta de email também contendo um link para o site PagerDuty para que eu pudesse ver mais informações. O PagerDuty teve um desempenho admirável durante meus testes, notificando-me respeitosamente em tempo hábil, seguindo minha política de escalação e re-notificando-me quando deixei de marcar um problema como resolvido.

A ajuda do PagerDuty é excelente. Cada página do portal inclui pelo menos um link para ajuda sensível ao contexto. Há também uma seção de introdução detalhada, que abrange tudo, desde tópicos básicos, como configuração e resposta a notificações, até tópicos mais avançados, como a criação de uma programação de plantão e políticas de escalação. A ajuda online também inclui informações detalhadas sobre a integração do PagerDuty a outras ferramentas de monitoramento, recursos do desenvolvedor e um formulário para enviar uma solicitação de suporte técnico.

Os relatórios do PagerDuty são muito diretos e fáceis de entender. Os relatórios podem ser mostrados em todo o sistema ou filtrados na política de serviço, equipe ou escalação. Também são fornecidas métricas de resumo que mostram o tempo médio de reconhecimento, o tempo médio de resolução, o número de incidentes escalados e muito mais. Essas informações são muito úteis operacionalmente, mas os gerentes provavelmente desejarão maior profundidade para fins de planejamento e análise, caso em que desejam obter esses dados do PagerDuty. Se você se inscrever em um plano corporativo, será possível exportar relatórios. O PagerDuty recomenda que você consulte os incidentes por meio da API deles, em vez de exportar relatórios.

Avaliação e avaliação de pagerduty