Lançado pela Microsoft em 2020, o DirectStorage chegou aos PCs para revolucionar o carregamento de jogos.
Forspoken (2023) foi o pioneiro, mas Ratchet & Clank: Rift Apart mostrou o potencial completo com descompressão por GPU, uma tarefa antes do CPU.
A teoria prometia um streaming de assets mais fluido e desempenho aprimorado, aliviando o gargalo da CPU.
Na prática, o oposto ocorreu inicialmente, especialmente com GPUs Nvidia.
GPUs, com seus milhares de núcleos, são extremamente eficientes em tarefas paralelas repetitivas.
GDeflate é um esquema de compressão de dados otimizado especificamente para descompressão por GPU.
No lançamento de Ratchet & Clank: Rift Apart, desativar o DirectStorage (forçando descompressão por CPU) resultou em melhor desempenho e frametime mais estável, principalmente em GPUs NVIDIA (RTX 3090/4090).
Marvel’s Spider-Man 2 (2025) replicou o problema: GPUs NVIDIA RTX 4090 mostravam ganhos de 18-25% nos 1% lows com DirectStorage desativado, indicando dificuldade em conciliar renderização e descompressão.
Testes iniciais com a RTX 5090 (Blackwell) mostraram que o DirectStorage não impacta mais o desempenho negativamente. Este artigo foca nas GPUs NVIDIA, pois as AMD Radeon não apresentaram esse problema.
Em Spider-Man 2 e Ratchet & Clank, a RTX 5090 mantém performance impecável com DirectStorage/descompressão por GPU, com até ganhos em framerate médio e 1% lows.
Mesmo a RTX 5070 (com 98%+ de uso de GPU em 1440p) e a RTX 5060 (com 98%+ de uso em 1080p) lidam com renderização e descompressão simultâneas sem perdas de desempenho.
A RTX 4060 sofre com a descompressão de assets, impactando a estabilidade dos 1% lows, enquanto a RTX 5060 demonstra fluidez superior.
Mesmo em sistemas com CPUs mais fracas e em resoluções mais baixas (720p), GPUs RTX de geração anterior ainda mostram queda de desempenho ao usar descompressão por GPU.
GPUs Blackwell (RTX 5090 a 5060) não sofrem degradação de performance com descompressão via GPU. Gerações anteriores da NVIDIA testadas ainda apresentam dificuldades.
A explicação mais provável para o melhor desempenho das RTX 50-series é o novo scheduler da arquitetura Blackwell, o AI Management Processor (AMP).
Ele otimiza cargas de trabalho assíncronas e foi construído especificamente para o HAGS (Hardware-Accelerated GPU Scheduling) do Windows, permitindo que a GPU gerencie sua própria memória de forma mais eficiente, sem depender tanto da CPU.
O AMP é um scheduler mais inteligente e eficiente, e essa otimização no agendamento de tarefas assíncronas é a provável causa do melhor desempenho das GPUs Blackwell com DirectStorage.