DirectStorage e Descompressão por GPU: Blackwell tem Vantagem?

Análise detalhada do desempenho das GPUs Blackwell da NVIDIA com a tecnologia DirectStorage em jogos.

O DirectStorage e a Descompressão por GPU: Blackwell tem Vantagem?

O Início do DirectStorage no PC

Lançado pela Microsoft em 2020, o DirectStorage chegou aos PCs para revolucionar o carregamento de jogos.

Forspoken (2023) foi o pioneiro, mas Ratchet & Clank: Rift Apart mostrou o potencial completo com descompressão por GPU, uma tarefa antes do CPU.

Expectativa vs. Realidade

A teoria prometia um streaming de assets mais fluido e desempenho aprimorado, aliviando o gargalo da CPU.

Na prática, o oposto ocorreu inicialmente, especialmente com GPUs Nvidia.

O Propósito do DirectStorage

  • Aproveitar SSDs NVMe ao máximo, como nos consoles modernos (PS5, Xbox Series X|S).
  • Reduzir drasticamente tempos de carregamento e acelerar o streaming de assets.
  • Permitir mundos de jogo mais vastos e densos.
  • DirectStorage 1.1 introduziu descompressão via GPU, otimizando o fluxo SSD -> RAM -> VRAM.

Por que a GPU para Descompressão?

GPUs, com seus milhares de núcleos, são extremamente eficientes em tarefas paralelas repetitivas.

GDeflate é um esquema de compressão de dados otimizado especificamente para descompressão por GPU.

Otimização GDeflate

  • Paralelismo Duplo: O fluxo de dados é dividido em blocos de 64 KB, compactados e descompactados separadamente.
  • Eficiência: Economiza ciclos da CPU, largura de banda da interconexão do sistema e espaço em disco, mantendo os dados compactados até atingirem a VRAM.

Vantagens Práticas

  • Menos necessidade de RAM do sistema, um benefício importante diante dos preços crescentes da DDR.
  • Texturas carregam mais rapidamente: fim das texturas borradas em jogos como Ratchet & Clank.

Problemas Iniciais (NVIDIA RTX 30/40)

No lançamento de Ratchet & Clank: Rift Apart, desativar o DirectStorage (forçando descompressão por CPU) resultou em melhor desempenho e frametime mais estável, principalmente em GPUs NVIDIA (RTX 3090/4090).

Marvel’s Spider-Man 2 (2025) replicou o problema: GPUs NVIDIA RTX 4090 mostravam ganhos de 18-25% nos 1% lows com DirectStorage desativado, indicando dificuldade em conciliar renderização e descompressão.

A Virada com as GPUs Blackwell (RTX 50-series)

Testes iniciais com a RTX 5090 (Blackwell) mostraram que o DirectStorage não impacta mais o desempenho negativamente. Este artigo foca nas GPUs NVIDIA, pois as AMD Radeon não apresentaram esse problema.

Desempenho da RTX 5090

Em Spider-Man 2 e Ratchet & Clank, a RTX 5090 mantém performance impecável com DirectStorage/descompressão por GPU, com até ganhos em framerate médio e 1% lows.

RTX 5070 e 5060: Sem Compromissos

Mesmo a RTX 5070 (com 98%+ de uso de GPU em 1440p) e a RTX 5060 (com 98%+ de uso em 1080p) lidam com renderização e descompressão simultâneas sem perdas de desempenho.

Contraste: RTX 4060 vs. RTX 5060

A RTX 4060 sofre com a descompressão de assets, impactando a estabilidade dos 1% lows, enquanto a RTX 5060 demonstra fluidez superior.

Mesmo em sistemas com CPUs mais fracas e em resoluções mais baixas (720p), GPUs RTX de geração anterior ainda mostram queda de desempenho ao usar descompressão por GPU.

Conclusão dos Testes

GPUs Blackwell (RTX 5090 a 5060) não sofrem degradação de performance com descompressão via GPU. Gerações anteriores da NVIDIA testadas ainda apresentam dificuldades.

O Mistério da Melhoria Blackwell: O Scheduler Aprimorado (AMP)

A explicação mais provável para o melhor desempenho das RTX 50-series é o novo scheduler da arquitetura Blackwell, o AI Management Processor (AMP).

Ele otimiza cargas de trabalho assíncronas e foi construído especificamente para o HAGS (Hardware-Accelerated GPU Scheduling) do Windows, permitindo que a GPU gerencie sua própria memória de forma mais eficiente, sem depender tanto da CPU.

O AMP é um scheduler mais inteligente e eficiente, e essa otimização no agendamento de tarefas assíncronas é a provável causa do melhor desempenho das GPUs Blackwell com DirectStorage.

Baseado no artigo de Tom’s Hardware