preloader
  • Redução de custo na Google Cloud com Kubernetes Autoscalling, Monitoramento e fluxo de CI/CD


A empresa

A MMCafé, líder no setor de comunicação interna desde sua fundação em 1993, oferece uma plataforma SaaS inovadora que proporciona uma solução completa para empresas de todos os portes, sendo reconhecida como uma das melhores Intranets do Brasil. Amplamente adotada por grandes e pequenas organizações, incluindo renomados bancos, a MMCafé consolidou sua relevância no mercado.

Com mais de 500 projetos implementados em 23 países, a MMCafé é reconhecida como líder no setor de Intranet, validada por prêmios como o IPP, que a nomeou como a Melhor Intranet do Brasil por dois anos consecutivos.

Sua presença global e aceitação por empresas de renome destacam sua posição como uma das principais soluções de Intranet. O reconhecimento por prêmios prestigiados demonstra a confiança e satisfação dos clientes em todo o mundo, solidificando ainda mais sua relevância e autoridade no setor.

Desafios

Garantir alta disponibilidade, performance e segurança

Construir um Kubernetes na infraestrutura do Google Cloud utilizando os recursos de alta disponibilidade, de acordo com as melhores práticas de segurança.

Reduzir custos sem comprometer o desempenho

Garantir que o cluster kubernetes tenha recursos de diminuição de custos sem comprometer o desempenho do ambiente.

Implementar DevOps e CI/CD com o time de desenvolvimento

Colaborar com o time de desenvolvimento da MMCafé para implementar práticas de DevOps robustas, incluindo integração contínua e entrega contínua (CI/CD).

Estabelecer um monitoramento 24x7 da plataforma

Implementar uma solução abrangente de monitoramento para garantir a disponibilidade e desempenho da infraestrutura 24x7.

A solução

Cluster de alta disponibilidade

Nosso trabalho envolveu a criação de um cluster Kubernetes, dimensionado para atender a uma grande base de clientes onde muitos deles operando 24x7. Implementamos regras de deploy e níveis de segurança para garantir a estabilidade e integridade do ambiente.

Pipelines CI/CD

Melhoramos a performance do fluxo de CI/CD, diminuindo os tempos dos builds, padronizando as pipelines, implementando deploy automatizado nos ambientes e melhorando a integração com as branches (trunk based deploy).

Monitoramento

Estabelecemos um processo abrangente de monitoramento que funciona 24x7, incluindo infraestrutura, serviços e aplicações, com dashboards e alertas personalizados, permitindo a identificação e resposta rápida a incidentes, além de compreender os gargalos do ambiente.

Estabelecemos um processo abrangente de monitoramento, permitindo a identificação e resposta rápida a incidentes, além de compreender os gargalos do ambiente. Esse monitoramento contínuo proporcionou dados valiosos à equipe técnica da MMCafé, permitindo ajustes nos códigos que resultaram em melhorias significativas de desempenho e redução do consumo de infraestrutura. Adotamos dashboards e alertas para otimizar e aprimorar as pipelines, reduzindo o tempo de “build” de cada versão.

Em termos de tecnologias, integrando Grafana e Zabbix, monitoramos continuamente o desempenho de nossos nodes e clusters de máquinas virtuais. Realizamos revisões diárias do desempenho para obter uma visão em tempo real da saúde e eficiência da infraestrutura. Além disso, desenvolvemos relatórios bimestrais abrangentes, aleḿ disso participamos de reuniões quinzenais fornecendo insights detalhados sobre tendências, anomalias e áreas de melhoria. Essas reuniõs nos capacitam a tomar medidas proativas para otimizar continuamente a infraestrutura e garantir sua operação ideal, alinhada com os objetivos estratégicos da empresa.

Autoscaling

A capacidade de expandir automaticamente os recursos de computação conforme necessário não apenas assegura a estabilidade operacional, mas também otimiza os custos ao evitar a subutilização ou superprovisionamento de recursos. No caso da MMCafé, o Autoscaling foi um pilar essencial, permitindo que nosso cluster Kubernetes se ajustasse em tempo real às necessidades variáveis dos usuários, garantindo simultaneamente a eficiência operacional e a capacidade de resposta ágil, fatores cruciais para o sucesso de nossa plataforma e a satisfação contínua do cliente.

Ambientes especializados para DEV, QA, PROD

Implementamos ambientes de desenvolvimento (dev), qualidade (QA) e produção (prod) para a MMCafé, garantindo estabilidade, segurança e eficiência. Criamos um cluster Kubernetes com regras de deploy e níveis de segurança rigorosos para manter a integridade dos ambientes. Essa abordagem permitiu que a equipe técnica trabalhasse em um ambiente de desenvolvimento seguro e estável, enquanto os ambientes de QA e prod foram configurados para testar e implantar novos recursos de forma eficaz e segura. Essa implementação foi essencial para garantir serviços confiáveis e de alta qualidade aos clientes da MMCafé.

Monitoramento

Implementamos um sistema de monitoramento 24x7 com ferramentas open-source, cobrindo infraestrutura, serviços e o fluxo de negócios da MMCafé. Este sistema inclui dashboards personalizados que identificam, em tempo real, gargalos e problemas em todas as camadas do sistema.

O monitoramento abrange desde o Auto-Scaling até as filas de aplicação, com alertas específicos para cada processo. Esses alertas são enviados ao grupo de comunicação que conecta o time de DevOps da MMCafé com nosso DevOps Gole, facilitando a resolução conjunta de problemas e a notificação de falhas ao time de desenvolvimento.

A personalização dos alertas permite identificar rapidamente o módulo com problemas, facilitando a resposta a incidentes e compreensão dos gargalos. Utilizamos dashboards e alertas para otimizar pipelines, reduzindo o tempo de build de cada versão.

Nosso sistema de monitoramento mensura o SLA da aplicação e gera relatórios de incidentes detalhados, assegurando uma gestão eficiente e melhoria contínua dos serviços prestados.

Continuidade

Melhoria contínua do ecossistema

Desde a implementação do ambiente, adotamos uma metodologia ágil baseada em Scrum, com sprints quinzenais para identificar e executar todas as atividades de melhoria. Nosso foco está na automatização das atualizações contínuas do ambiente, priorizando a segurança e estabilidade. Sempre que necessário, novos serviços são implementados para garantir a eficiência operacional.

Uma vez finalizada a reunião de sprint criamos uma ata que contém a data, os nomes dos participantes, e o estado de cada tarefa, por exemplo, Open, In Progress ou Done.

Monitoramento

As ferramentas de monitoramento fornecidas a MMCafe estão em constantes atualizações tanto de programas e plug-ins como de dashboards personalizados. O monitoramento contínuo forneceu dados valiosos para ajustes no código, resultando em melhorias de desempenho e redução do consumo de infraestrutura.

Todos os dias úteis, nos horários de maior acesso, realizamos uma revisão manual nos dashboards garantindo que o ambiente esta em excelentes condições. Esse monitoramento manual é feito no minimo três vezes por dia.

Relatórios

Relatório de Incidente

Sempre que atuamos em um incidente, criamos um relatório detalhado. Este inclui a descrição do sintoma, horário de início e fim, ações realizadas, solução paliativa e causa. Quando a causa é desconhecida, sugerimos a abertura de um problema e buscamos uma solução definitiva posteriormente.

Relatório Bimestral

A cada dois meses entregando o relatório bimestral contendo o SLA dos ambientes e sites; o status da revisão manual, caso tenhamos levantado algum alerta indicamos como o mesmo foi superado; e todas as ações realizadas dentro dos dois meses.

Resultados

A moderna infraestrutura da Google Cloud e a arquitetura Kubernetes realizada pela Gole trouxeram agilidade, eficiência e redução de custos. Devido a forma de implementação e a elasticidade da solução a MMCafé pode seguir contatando novos clientes sem ter que se preocupar com infraestrutura. A segurança da Google Cloud garantiu a integridade dos dados e fortaleceu a posição competitiva da empresa.

Depoimentos

“Estamos muito satisfeitos com a maneira como os serviços da sua empresa impactaram positivamente a nossa. A disponibilidade da equipe em lidar com demandas de urgência tem sido fundamental para a nossa operação. Em várias ocasiões, quando enfrentamos desafios inesperados, a equipe esteve prontamente à disposição para nos ajudar a resolver problemas de forma eficiente, o que teve um impacto direto na nossa capacidade de atender aos nossos clientes.” Adriano Silva - Analista DevOps

“A Gole criou um processo de monitoramento de todo o ambiente para que a equipe da MMCafé pudesse fazer vários ajustes para melhorar a performance e reduzir o consumo de infraestrutura. Em conjunto ambas equipes fizeram otimizações e melhorias nas pipelines reduzindo tempo de build de cada versão. A plataforma está estável e saudável. A busca por melhorias é constante. Sem a implementação feita pela Gole, a infraestrutura atual teria um custo no mínimo 2,5 vezes maior.” Eduardo Pires - Diretor Comercial

Entre em contato e agende uma reunião de diagnóstico

Fale Conosco