Durante a tarde desta terça feira ficou bem claro que a Amazon controla grande parte dos serviços de cloud. Bastaram uma série de erros por parte da gigante americana para que muitos serviços tivessem deixado de funcionar correctamente. Hoje, fica provado que a consolidação de serviços cloud num único provedor de serviços é um erro gritante, e que cada vez mais a redundância é obrigatória.

Ao contrário daquilo que as pessoas pensam, a Amazon não vende apenas livros a preços bastante razoáveis. A Amazon é responsável pela Amazon Web Services (AWS), uma componente da empresa que é responsável por fornecer uma série de produtos de computação na cloud. Um desses produtos, é o Amazon Simples Storage Service (S3), e foi este produto que sofreu erros críticos que acabaram por parar e eliminar uma grande parte dos serviços disponíveis na Internet, sendo que muitas dessas aplicações tiveram que parar de funcionar mesmo. É o caso do Slack e do Trello, onde os vários utilizadores deixaram de ter acesso aos seus documentos, assim como se viram privados de continuar o upload de outros ficheiros. Sim, a Amazon diz que o seu produto S3 está desenvolvido para ter uma disponibilidade de 99,99999999% do tempo mas … quando uma peça da infraestrutura falhou na AWS, uma série de serviços também falhou!

Isto apenas aconteceu porque a Amazon controla uma percentagem ridícula de mercado no que diz respeito a computação na cloud e, neste caso especificamente, no que diz respeito a armazenamento na cloud. Um estudo recente da Gartner em Agosto de 2016, dizia que a AWS detinha 31% do mercado de infraestrutura cloud, sendo que o negócio estava a subir bastante. O mesmo estudo, mostrava que a AWS era responsável por 51% dos lucros da Amazon. No entanto, outros estudos feitos na mesma altura por outras entidades, apontavam que a cota de mercado da Amazon nos serviços cloud deveria rondar os 45%. Hoje em dia, Microsoft, IBM, Google e muitos outros tem vindo a expandir as suas ofertas cloud mas a Amazon continua a ser líder e a crescer no mercado de cloud, um mercado que já lidera desde que o iniciou em 2006.

Portanto, desde há uma década que a Amazon tem sido a senhora da Cloud, sendo que durante este tempo permitiu que muitas startups baseassem o seu modelo de negócio nos seus serviços. O motivo? Bom, é capaz de ser o serviço mais acessível que permite às empresas mais recentes no mercado, e com menos dinheiro disponível, soluções de armazenamento e computação na cloud a preços acessíveis e altamente escaláveis.

Mas o que acontece quando a quota de mercado é enorme e as empresas que usam os nossos serviços não têm redundância, apesar de estarmos num mercado Cloud? As falhas, como a que a Amazon experienciou hoje, são simplesmente catastróficas e ampliadas ao máximo. E um falha de serviços que leva a uma indisponibilidade de 0,00000001% de tempo, torna-se um grave problema para milhões de utilizadores em todo o mundo. A Amazon ainda não divulgo números acerca dos problemas que afectaram o serviço S3, sendo que entre o que esteve afectado, poderão estar serviços, aplicações, páginas web … enfim, tudo e mais alguma coisa onde a Internet assenta nos dias de hoje. Eu fui um dos afectados, e posso dizer que a experiência foi do pior que pode existir (ainda agora, o slack não permite um simples upload de ficheiro).

Mas será que o problema está apenas do lado da Amazon? Todos os serviços têm pontos de falha, e decerto que a Amazon procurou ao máximo reduzir o impacto da falha e, a verdade seja dita, ao longo dos inúmeros anos em que já fornece serviços de cloud, foram muito poucas as falhas que foram significativas. É certo que hoje foi um dia muito complicado para os engenheiros e administradores de sistemas da gigante americana, mas é bom que esta dor de cabeça também chegue junto de quem cria serviços como o Trello e o Slack, baseados apenas num único serviço de alojamento, como a AWS.

A paragem de hoje destes serviços, acontece devido à falta de redundância de serviços destas empresas. Bastava que o serviço estivesse replicado noutro provedor de serviços cloud, para que a falha tivesse sido mínima. E sim, se isso por acaso acontecesse, a Internet não tinha caído da maneira que caiu hoje. Por isso a culpa desta falha na Internet, é da Amazon, mas também de todas as empresas que teimam em reduzir custos ao máximo ignorando os seus utilizadores e a possível falha crítica que tem 0,00000001% de probabilidade de acontecer, mas que acaba sempre por acontecer.

No meio disto tudo, quem acaba por ganhar são os comerciais que têm a responsabilidade de vender os serviços cloud da Microsoft, IBM ou outras marcas. Afinal de contas, têm neste momento nas mãos a maior prova possível de que a Amazon não é 100% fiável, tendo neste momento dados que provam isso mesmo. Afinal de contas, até o Whatsapp sofreu problemas no envio de imagens!

Até ao momento, não há qualquer explicação oficial da Amazon para as falhas críticas que afectaram o S3 (mais precisamente os serviços alojados em US-EAST-1), sendo que os últimos comentários apenas garantem que o problema ainda existe e que está a tentar ser resolvido o mais depressa possível.

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui