Balanceamento de Carga (Loading Balacing)

March 17, 2025

This content originally appeared on DEV Community and was authored by Yuri Peixinho

É o processo de distribuir requisições de usuários de forma inteligente entre múltiplas instâncias de um serviço, como uma aplicação MVP, por exemplo. Garantindo:

Alta disponibilidade (se uma instância falhar, outras continuam funcionando)
Melhor desempenho (divide o tráfego, evita sobrecarga em uma única instância)
Escalabilidade horizontal (pode adicionar/remover instâncias conforme a demanda)

Em outras palavras: em vez de o usuário bater sempre no mesmo servidor, ele passa primeiro por um “porteiro inteligente” que direciona para uma das réplicas disponíveis.

Como funciona

Quando um cliente (navegador, app, etc.) envia uma requisição para o sistema, o Load Balancer atua como um intermediário que decide para qual instância da aplicação essa requisição será direcionada

Exemplo prático:

Usuário → Load Balancer → Instância 1
                             → Instância 2
                                     → Instância 3

Analogia simples:

Pensa num restaurante com 5 garçons (servidores de aplicação). Ao invés dos clientes (usuários) escolherem um garçom direto, existe um host na entrada (o load balancer) que direciona cada cliente para um garçom disponível.

Isso:

evita que todos corram pro mesmo garçom
garante que todos sejam atendidos rápido
permite que você tire um garçom pra descansar sem afetar o atendimento

This content originally appeared on DEV Community and was authored by Yuri Peixinho