Episódio 2: Sistemas e equipamentos vitais no Data Center
Servidores, racks e infraestrutura de rede
Quando entrei no data center pela primeira vez, o que mais me impressionou foram os corredores repletos de racks, aquelas estruturas metálicas (estantes) organizadas que abrigam os servidores e os principais equipamentos de rede. Dentro de cada rack é onde ficam organizados os servidores que são os principais protagonistas de toda essa história, isso porque tudo gira em volta dos servidores. São eles que processam as informações, executam aplicações e armazenam os dados que fazem o mundo digital funcionar. Todos os websites, aplicativos online, redes sociais, vídeos do Youtube, facebook, tuas fotografias no google fotos, tudo isso fica guardado dentro do servidor.
Cada servidor é conectado à infraestrutura de rede através de switches, roteadores, firewalls e cabos meticulosamente organizados. Essa infraestrutura é o que permite que os dados fluam dentro do data center e entre o data center e o mundo exterior. Tudo ali é planejado para garantir o máximo de desempenho e a menor latência possível. Latência é basicamente o atraso na comunicação, isso pode ser causado por vários factores, como o tipo de cabo condutor usado na rede, a distância entre outros.
E não se trata só de ligar equipamentos em qualquer lugar. Existe um rigor técnico na disposição dos racks, no gerenciamento dos cabos, no fluxo de ar para refrigeração e na distribuição do peso no piso elevado. Cada detalhe é pensado para evitar falhas e facilitar a manutenção.
Geradores, transformadores, baterias: como tudo se conecta
Por trás dos servidores e da infraestrutura de rede está o que eu gosto de chamar de coração energético do data center, que são os sistemas de fornecimento de energia esses garantem que nada pare, mesmo em momentos de crise.
Os transformadores recebem a energia da concessionária (no nosso caso, a EDM - Electricidade de Moçambique) e distribuem para os quadros principais, que eram os ATS (Automatic Transfer System), estes sistemas recebem a energia de duas fontes, que é o gerador e o transformador. De um modo geral a principal função do ATS é garantir o fornecimento contínuo de energia elétrica, alternando automaticamente entre duas fontes de alimentação diferentes, geralmente uma fonte primária (como a rede elétrica - o transformador) e uma fonte de backup (como um gerador) em caso de falha da fonte primária.
Após passar por um ATS (Automatic Transfer System) a energia é distribuída a um painel de nome EMDB (Electrical Main Distribution Board), este é o Quadro Principal de Distribuição Eléctrica, é responsável por receber a energia da fonte principal e distribuí-la para vários circuitos e áreas dentro do data center. O EMDB actua como o centro de controle centralizado do sistema eléctrico, garantindo que a energia seja distribuída de forma segura e eficiente para diferentes cargas.
Do EMDB a energia flui para os outros painéis de distribuição eléctrica, onde temos:
- ACDB (Alternate Current Distribution Board): Distribui a energia em corrente alternada (CA) vinda da concessionária ou geradores para os sistemas do data center (ex: ar condicionado, iluminação).
- UPSDB (Uninterruptible Power Supply Distribution Board): distribui a energia em Corrente Alternada (CA) dos no-breaks (UPS) para os equipamentos críticos, garantindo alimentação ininterrupta em caso de falhas na rede. (ex:servidores, storages, switches, roteadores)
- DCDB (Direct Current Distribution Board): distribui energia em corrente contínua (CC) para equipamentos que funcionam em CC (ex: equipamentos de telecomunicação, sistemas de alarme, controle de acesso)
Esses são os principais painéis, sempre que acontecer alguma falha no sistema de alimentação é para esses painéis que se olha primeiro, existem outros painéis mas esses são de nível mais baixo de distribuição.
Observe que toda essa estrutura desde o Transformador, ATS, EMDB, ACDB, UPSDB e DCDB segue o padrão de redundância, ou seja duas fontes para cada um dos painéis, por exemplo, tínhamos TF1 e TF2, Gerador 1 e Gerador 2, ATS1 e ATS2, EMDB1 e EMDB2, e por aí vai, essa organização assegurava que na falha de uma fonte a outra poderia estar operacional.
Quando há uma falha no fornecimento externo, quem assume primeiro são as baterias. E é aqui que está o papel vital delas: as baterias mantêm os equipamentos críticos activos nos segundos cruciais até que os geradores arranquem. Esse processo costuma levar entre 20 e 30 segundos, e para que a corrente se estabilize por completo nos geradores, são necessários cerca de 2 minutos. Esse curto espaço de tempo é o que separa o sucesso de um desastre em termos de disponibilidade de serviço.
Os geradores, por sua vez, são os que fornecem a potência a toda carga. No ambiente em que trabalhei, contávamos com um MTU de 1400 kVA e dois Himoinsa de 810 kVA. Eles são preparados para manter o data center operacional por longos períodos durante interrupções prolongadas no fornecimento de energia pública. Todo esse conjunto de transformadores, baterias e geradores é perfeitamente integrado para garantir a continuidade operacional.
O conceito de redundância e os Tiers
Nenhuma dessas peças funciona de forma isolada. O segredo de um data center está no conceito de redundância. Isso significa ter sistemas duplicados e independentes para que, se um falhar, o outro automaticamente entre em ação sem impacto nos serviços. É como se todo o data center tivesse um plano B (e até um plano C), pronto para ser acionado instantaneamente.
Essa filosofia de projecto está ligada ao conceito de Tiers, um padrão definido pelo Uptime Institute para classificar data centers de acordo com seu nível de resiliência:
Tier I: infraestrutura básica, com poucos ou nenhum componente redundante.
Tier II: oferece alguma redundância em componentes críticos.
Tier III: tolera falhas e permite manutenção sem desligamento dos serviços (N+1 em componentes essenciais).
Tier IV: o mais alto nível, totalmente tolerante a falhas, com sistemas duplos e independentes para todos os componentes críticos (é o tipo de ambiente em que eu trabalhei).
Trabalhar em um Tier IV foi uma grande escola para mim. Lá aprendi o valor da prevenção, do planejamento e do rigor técnico para manter um ambiente sempre disponível. É um nível em que não há margem para erros: tudo é pensado para funcionar 24x7x365, sem excepção.
Conclusão
Os sistemas e equipamentos de um data center são muito mais do que peças tecnológicas. São o resultado de décadas de evolução em engenharia e infraestrutura, todos trabalhando em conjunto para garantir que o mundo digital nunca pare.
No próximo episódio, vou explorar o monitoramento e as rotinas de operação dentro de um data center, mostrando como o trabalho humano é indispensável para que toda essa engrenagem continue a girar com perfeição.
Fica mais uma dica: para quem busca uma carreira sólida em TI, entender a fundo esses sistemas e conceitos de redundância é um grande diferencial.
Até breve!
#filipe-chau #tsalaCode #mozitroom #DataCenter #DataCenters #DataCenterLife #DataCenterEngineering #SistemasDeTI #InfraestruturaTI #EquipamentosTI #Servidor #Racks #InfraestruturaDeRede #Switch #Roteador #Firewall #Transformador #Gerador #Baterias #ResilienciaTI #AltaDisponibilidade #Redundancia #NuvemComputacao #CloudComputing #TI #TecnologiaDaInformacao #TransformacaoDigital #UptimeInstitute #DataCenterTier #TierI #TierII #TierIII #TierIV #EngenhariaEletronica #EngenhariaEletrica #EngenhariaTelecomunicacoes #Informatica #CarreiraTI #OportunidadesTI #JovensTalentosTI #TecnologiaMoçambique #MoçambiqueDigital #BlogTecnologia #PostNovo #ConteudoTecnico #filipechau #DicaDeCarreira #CompartilheConhecimento #Aprendizado #FuturoDigital #Inovacao #EducacaoTecnologica
Comentários