O desktop Linux vive um momento de transformação silenciosa, mas profunda. Quando você liga o computador e vê a interface gráfica carregando, tudo parece simples: janelas, ícones, textos, movimentos de mouse. Por trás dessa aparente simplicidade, no entanto, existe uma pilha de tecnologias que vem sendo repensada do zero. O protagonista dessa mudança é o Wayland, um protocolo que promete substituir o velho X11, também conhecido como Xorg, e redefinir a forma como o Linux lida com gráficos, entrada e segurança.
Para entender o que está em jogo, é preciso voltar no tempo. O protocolo X11 foi lançado em 1987. Naquela época, a computação era dominada por mainframes enormes e terminais burros. O X11 foi projetado para resolver os problemas daquele mundo: permitir que um programa rodando em um computador central enviasse comandos de renderização para um terminal remoto, que exibia a interface na tela do usuário. Essa arquitetura cliente servidor era revolucionária para a época, mas carrega até hoje as marcas de sua origem.
No modelo do X11, o servidor gráfico (o Xorg) é uma entidade separada do compositor (como o GNOME Shell ou o KWin). O compositor é apenas mais um cliente do servidor, com os mesmos poderes que qualquer outro programa. Para desenhar uma janela, o aplicativo conversa com o Xorg, que conversa com o compositor, que devolve a informação para o Xorg, que finalmente envia o quadro para o kernel e deste para o monitor. Cada passo envolve trocas de contexto, mudanças de estado do processador, limpeza de caches e cópia de dados. Um simples clique do mouse percorre um caminho igualmente tortuoso: do kernel para o Xorg, do Xorg para o compositor, do compositor de volta para o Xorg, e então para o aplicativo final. Toda essa comunicação entre processos gera latência, consome energia e impõe um limite difícil de superar.
Os problemas que o X11 não consegue mais resolver
Os engenheiros que trabalham no Xorg há anos já extraíram todo o desempenho possível dessa arquitetura. Mas há limitações fundamentais que não podem ser contornadas sem quebrar o protocolo. O exemplo mais clássico é o chamado tearing, aquela falha visual em que a imagem parece cortada horizontalmente porque partes de quadros diferentes foram exibidas ao mesmo tempo. O X11 não consegue garantir que o quadro final seja perfeito. O desenvolvedor Christian Hosberg, que mais tarde criaria o Wayland, tentou resolver o problema com uma extensão chamada DRI2. A solução funcionou em parte, mas uma garantia completa era logicamente impossível dentro das regras do X11.
Outro problema grave é a impossibilidade de usar recursos modernos de hardware. Monitores atuais, especialmente os usados em celulares e notebooks, trabalham com múltiplos planos (ou camadas). O cursor do mouse pode estar em um plano separado do conteúdo principal. Um vídeo pode estar em outro plano, de forma que o monitor combine essas camadas sozinho, sem que o computador precise redesenhá lo quadro inteiro. Esse mecanismo economiza energia e reduz drasticamente o processamento necessário. No X11, o compositor não tem acesso a esses planos porque quem controla o hardware é o servidor gráfico. O compositor apenas envia uma imagem final pronta e não pode instruir o monitor a tratar diferentes elementos em camadas separadas. Tecnologias como HDR, múltiplas taxas de atualização variáveis e até mesmo suporte adequado a tablets gráficos esbarram nas mesmas limitações.
A segurança é outro ponto crítico. No X11, qualquer programa pode ler o que está sendo digitado em qualquer janela, capturar a tela inteira, injetar eventos de teclado ou mouse e mover janelas de outros aplicativos. Isso não é um bug, é uma característica do protocolo, que foi concebido em uma época em que todos os programas em um sistema eram confiáveis. Um exemplo concreto: para corrigir um bug no OBS Studio que envolvia interações entre o navegador e a captura de tela, um desenvolvedor precisou escrever um programa de 50 linhas que monitorava tudo o que acontecia no X11, incluindo teclas digitadas e janelas abertas. Esse mesmo código, se mal intencionado, seria um keylogger perfeito funcionando sem nenhuma restrição. No Wayland, simplesmente não existe um mecanismo que permita a um programa comum fazer isso. Apenas o composidor tem acesso privilegiado.
O nascimento do Wayland como evolução natural
Christian Hosberg, já cansado de tentar consertar o tearing dentro do X11, teve uma nova ideia enquanto viajava por uma cidade chamada Wayland. Ele percebeu que, para garantir quadros perfeitos, seria necessário mudar a forma como o protocolo lidava com números, com comunicação entre processos e com o próprio conceito de composição. Começou a implementar as mudanças e, aos poucos, percebeu que o resultado já não se parecia em nada com o X11. As discussões sobre uma possível versão X12 foram abandonadas, e o novo projeto ganhou o nome da cidade que inspirou a ideia.
O Wayland não é uma rejeição ao X11, mas uma evolução natural. Sua arquitetura funde o servidor gráfico e o compositor em um único componente. No GNOME, por exemplo, o Mutter (compositor) também é o servidor Wayland. Não há mais separação. Isso reduz drasticamente a comunicação entre processos. Para desenhar um quadro, o aplicativo conversa diretamente com o compositor, que já tem acesso ao kernel e ao hardware. A latência cai, o consumo de energia diminui e o sistema se torna mais responsivo.
Além disso, o Wayland permite explorar os planos de hardware. O compositor pode dizer ao monitor: coloque este vídeo no plano secundário, deixe o cursor no plano do cursor, e apenas atualize o quadro do vídeo a cada 60 quadros por segundo. O resto da tela nem precisa ser redesenhado. Essa é a mesma técnica que celulares usam para oferecer autonomia de bateria de horas durante a reprodução de vídeo. No X11, isso é simplesmente impossível de implementar sem quebrar o protocolo.
O preço da segurança: portais e permissões
A maior reclamação sobre o Wayland é que algumas coisas que funcionavam facilmente no X11 deixaram de funcionar ou passaram a exigir mais etapas. Desativar uma única tecla do teclado que estava permanentemente pressionada, por exemplo, era trivial no X11 com uma linha de comando. No Wayland, o mesmo feito não era possível porque o protocolo não permite que um programa modifique o comportamento do teclado do sistema sem passar por um mecanismo de permissão explícito.
Essa aparente perda de conveniência é, na verdade, o preço de uma segurança real. A analogia mais direta é com a porta da sua casa. Ter uma chave e trancar a porta toda vez que você sai é uma injeção de saco, mas ninguém em sã consciência sugeriria morar sem porta. O X11 era essa casa sem porta: qualquer programa podia entrar e sair livremente. O Wayland, combinado com outras tecnologias como os portais e o Flatpak, constrói uma plataforma segura por camadas.
Os portais são uma interface padronizada que permite a aplicações solicitarem acesso a recursos sensíveis sem ganhar privilégios permanentes. Quando o OBS Studio quer capturar a tela no Wayland, ele não pode simplesmente ler o framebuffer como fazia no X11. Ele faz uma requisição através de um portal, e o sistema operacional exibe um diálogo perguntando se você permite a captura. Você pode autorizar uma vez, autorizar sempre ou negar. O aplicativo nunca recebe um acesso irrestrito. O mesmo vale para selecionar arquivos, ler notificações, enviar atalhos de teclado ou interagir com outras janelas.
Os portais nasceram do esforço de empacotamento Flatpak, que por sua vez herdou ideias de um sistema chamado OS3, criado para integração contínua no GNOME há mais de uma década. A ideia central é que um aplicativo começa em uma caixa preta sem nenhum acesso ao sistema. O desenvolvedor então declara quais recursos precisa, e o portal atua como um elo seguro entre o aplicativo e o desktop. O aplicativo pede um arquivo, o portal mostra o seletor de arquivos (do GTK, do Qt ou de qualquer toolkit), o usuário escolhe, e o aplicativo recebe apenas aquele arquivo, sem nunca saber o caminho completo ou ter acesso a outros diretórios.
Essa integração entre Wayland, portais e Flatpak forma o que se pode chamar de plataforma Linux moderna. Não há um componente único responsável por tudo. Cada um faz sua parte, e juntos eles oferecem um nível de segurança e modernidade comparável ao que existe no Windows e no macOS.
Como funciona nos outros sistemas operacionais

Para entender melhor a transição do X11 para o Wayland, vale a pena olhar rapidamente para o que acontece no Windows e no macOS. Esses sistemas nunca passaram pela arquitetura cliente servidor descentralizada do X11 porque sempre foram controlados por uma única empresa que podia ditar mudanças radicais de tempos em tempos.
No Windows moderno, o sistema gráfico é centrado no DWM (Desktop Window Manager). O DWM é um compositor que integra o gerenciamento de janelas, os efeitos visuais e a renderização final usando DirectX. Cada aplicativo desenha seu conteúdo em uma superfície (geralmente usando DirectX ou GDI), e o DWM combina essas superfícies em um quadro final. A comunicação entre aplicativos e o DWM é otimizada e acontece em grande parte dentro do espaço do kernel ou através de chamadas rápidas. O Windows também suporta planos de hardware (multi plane overlay) há muitos anos, especialmente para vídeo e jogos. A segurança é garantida por um modelo de integridade e isolamento de processos: um aplicativo normal não pode capturar a tela ou injetar eventos sem permissão explícita da API, e versões recentes exigem confirmação do usuário para captura de tela.
O macOS segue filosofia semelhante com o Quartz Compositor (também chamado de WindowServer). O compositor é um processo privilegiado que gerencia todas as janelas, aplica efeitos de transparência e sombras, e envia o resultado final para a placa de vídeo. Aplicativos desenham em superfícias (via Core Graphics, Metal ou OpenGL) e o WindowServer combina tudo. O acesso a essas superfícias por outros aplicativos é estritamente controlado pelo sistema de permissões, que exige consentimento do usuário para gravação de tela ou monitoramento de entrada.
Em ambos os casos, a arquitetura é essencialmente a mesma que o Wayland propõe: um compositor central que controla o hardware e gerencia a segurança, com aplicativos isolados que se comunicam de forma controlada com esse compositor. O Linux, durante décadas, ficou preso ao X11 por razões históricas e pela necessidade de manter compatibilidade com uma infinidade de aplicativos e drivers. O Wayland finalmente traz o Linux para o mesmo patamar dos sistemas operacionais modernos.
O futuro já começou
A transição não tem sido simples. O X11 esteve presente por quase quarenta anos. Muitos aplicativos, bibliotecas e fluxos de trabalho foram construídos assumindo que qualquer programa pode fazer qualquer coisa. O ecossistema do Linux é enorme e diverso, e migrar tudo isso leva tempo. Mas a direção é clara. Grandes distribuições já adotaram o Wayland como padrão em suas edições mais recentes. O GNOME removeu todo o código de suporte ao X11 em sua última versão. O KDE Plasma e o wlroots (usado pelo Sway e outros compositores) estão maduros e estáveis.
As vantagens para o usuário comum ainda são discretas, mas começarão a se tornar evidentes nos próximos anos. Menos tearing, menor latência de entrada, melhor suporte a monitores de alta taxa de atualização, HDR funcionando de verdade, maior duração de bateria em notebooks, e uma segurança muito mais robusta contra malware que tenta espiar o que você digita ou capturar sua tela sem permissão.
O X11 foi extraordinário para o seu tempo. Sem ele, o Linux talvez nunca tivesse decolado como desktop. Mas a computação de 2025 não é a mesma de 1987. O hardware mudou, as ameaças mudaram, e as expectativas dos usuários mudaram. O Wayland não é uma moda passageira nem uma conspiração contra o software livre. É o resultado orgânico de pessoas que enfrentaram problemas reais e, ao tentar resolvê los da melhor forma possível, construíram algo novo. Como disse o desenvolvedor Georges Stavracas, se você colocar três ou quatro programadores em uma sala trancada por um dia, no dia seguinte a sala estará fedida, mas muitas ideias novas terão nascido. O Wayland é uma dessas ideias. E o desktop Linux, finalmente, está se preparando para as próximas décadas.