Sua Internet está MESMO inativa

Por Patrick Hubbard

 

O estande de exposição da SolarWinds é enfeitado com bótons e adesivos de técnicos de TI que lamentam, comemoram e se simpatizam com as frustrações diárias dos administradores de TI. O preferido é um adesivo de laptop que informa corretamente às pessoas que “a Internet não está INATIVA”, em letras garrafais. Por sua natureza, a Internet não pode estar inativa. Obviamente, piadas desse tipo são hilárias. Mas isso é verdade? Se não existisse "a Internet" e cada um de nós tivesse uma Internet exclusiva, ela certamente poderia ficar inativa. Patrick_Head_Geek

 

Lama e fibra

 

A probabilidade de ocorrer uma verdadeira falha crítica na conectividade da Internet principal tornou-se extremamente baixa.  A redundância "standby" de alta largura de banda e o failover automatizado são agora habituais até para empresas de médio porte. Sim, uma equipe de construção pode nos colocar em contato com o escritório do CIO quando uma retroescavadeira danificar gravemente várias fibras, e o reparo pode levar muitas horas em um local lamacento. Essa é a única forma de nos deixar totalmente offline, e não o tipo de falha com o qual normalmente nos preocupamos. Na verdade, nós enfrentamos, sem saber, várias quedas silenciosas até muitas vezes por dia.

 

A maior causa de falha na transmissão e problemas de desempenho é exatamente a estrutura robusta da própria Internet. A qualquer momento, até os caminhos básicos de transmissão entre pontos de extremidade dentro da mesma região metropolitana podem ter milhares de variações de roteamento, um determinado pacote no momento do próximo salto. É como um jogo de xadrez de roteamento indeterminado, em que todos os sistemas participantes jogam ao mesmo tempo. Uma vez que a proliferação de opções de salto estava limitada ao custo da reconfiguração das redes da operadora, isso já não acontece. As operadoras agora gerenciam programaticamente as redes internas, criando e destruindo várias rotas virtuais durante o dia para atender à demanda específica.

E quando a estrutura básica da qual nós dependemos cada vez mais para o tráfego de serviços críticos é tão mutável, um único link errado pode facilmente criar problemas reais para o usuário final que são difíceis de resolver, principalmente fora do firewall. Por exemplo, se o seu ISP principal mantém um balanceamento de carga ativo/ativo dos quatro caminhos com multihoming entre os hubs do backbone, a pessoa pode se sentir confiante. Porém, se apenas um desses links começar a perder pacotes por causa de congestionamento, os usuários enfrentarão uma perda de pacotes de 25% silenciosamente.

 

Ferramentas antigas não ajudam

 

O rastreamento de rotas faz o possível, graças à dedicação dele. No entanto, ele somente relata as decisões do próximo salto no momento da execução. Um primeiro momento comum de confusão real enfrentada pelos novos administradores é quando um rastreamento de rotas diferente aparece no relatório após um segundo teste, apenas alguns minutos depois. O comando ping, em toda a sua maravilhosa simplicidade, ainda é melhor para demonstrar a assimetria ao revelar rapidamente sinais indicativos de um link com multihoming afetado. 5 ms, 6 ms, 5 ms, 120 ms, 4 ms, 7 ms, 9 ms, 3 ms, 154 ms, 3 ms, 5 ms, 8 ms, 261 ms. Você consegue ver?

 

As ferramentas especializadas que muitos engenheiros utilizam diariamente simplesmente não foram desenvolvidas para uma Internet moderna e irreconhecível, em que um único problema temporário em milhares de variações de rotas pode resultar em ligações para a central de ajuda. É muito fácil perceber que o roteamento externo está fora do controle; fizemos o melhor possível e esperamos que o santo padroeiro dos ISPs olhe por nós. Eu conheço um administrador que tem a imagem do Santo Isidoro de Sevilha virada de ponta-cabeça em frente ao NOC.

 

Preocupe-se apenas com o seu serviço de Internet

 

Felizmente, não precisamos nos preocupar com "a Internet". A “sua Internet” é um conjunto relativamente minúsculo de possíveis rotas por onde seus aplicativos e usuários finais realmente passam. Dessa forma, você pode usar uma solução de monitoramento de rede moderna para descobrir e visualizar não apenas suas rotas internas mais determinísticas, mas incluir um superconjunto de links possíveis fora do firewall. Com uma pequena descoberta, você pode acompanhar o curioso caminho pelo qual seus pacotes percorrem, pelos atalhos complicados das sobrecargas do ISP e em torno de links virtuais sem sinais que eles talvez nem saibam que estão inativos.

 

Ao longo do tempo, é impressionante descobrir o que acontece quando você busca informações sobre a Internet. Ela é mais previsível do que você pode imaginar, já que as alterações regulares na oscilação e no fluxo da rota começam a seguir um padrão em cada rota geral. Os sistemas são capazes de aprender a enviar alertas de maneira mais inteligente, não apenas quando a latência total exceder um limite, mas quando algum padrão relacionado à natureza do atraso já for conhecido. Talvez você até descubra que o monitoramento ativo além do firewall seja um convite para você entrar no seleto clube de um ISP. Alguma vez, você já ligou para o suporte técnico do seu ISP e falou o nome exato do roteador deles que está provocando a perda de pacotes? Experimente fazer isso. Eles gaguejam um pouco, depois fazem várias perguntas sobre seus métodos e, por fim, você ouve uma interjeição de admiração. É uma sensação maravilhosa.

Patrick Hubbard, gerente técnico da SolarWinds

 

Share This Post

Post Comment