DirectStorage: A Revolução Blackwell na Descompressão por GPU

Análise aprofundada revela como as novas GPUs Nvidia superam desafios de desempenho e otimizam a experiência de jogo com a tecnologia.

DirectStorage: A Revolução Blackwell na Descompressão por GPU

Lançado pela Microsoft em 2020, o DirectStorage visa transformar o carregamento de jogos no PC, explorando o potencial máximo dos SSDs NVMe com mínima intervenção da CPU. A versão 1.1 introduziu o suporte à descompressão de assets via GPU, um marco que prometia maior fluidez e mundos mais densos ao mover essa tarefa da CPU para a GPU.

O Que é a Descompressão por GPU?

  • Propósito: Transferir a carga de descompressão de dados (como texturas e modelos) da CPU para a GPU.
  • GDeflate: Um esquema de compressão otimizado para paralelismo de GPU, permitindo que milhares de núcleos trabalhem simultaneamente na descompressão de dados.
  • Benefícios Teóricos: Tempos de carregamento reduzidos, streaming de assets mais rápido, mundos de jogo maiores e mais detalhados, e economia de ciclos de CPU e largura de banda do sistema.

Os Desafios Iniciais: Geração RTX 30/40

Nos primeiros jogos a implementar a descompressão por GPU, como Ratchet & Clank: Rift Apart e Marvel’s Spider-Man 2, usuários de GPUs Nvidia da série RTX 30 e 40 reportaram problemas. Desativar o DirectStorage (voltando à descompressão por CPU) resultava em melhor desempenho, especialmente na estabilidade dos frametimes e nos 1% lows, indicando que essas GPUs lutavam para gerenciar a renderização e a descompressão simultaneamente.

A Virada com as GPUs Blackwell (RTX 50)

Testes recentes com a nova arquitetura Blackwell, presente nas GPUs da série RTX 50 (desde a 5090 até a 5060), demonstram uma mudança significativa. Diferente das gerações anteriores, as placas Blackwell não apenas evitam a degradação de desempenho com a descompressão por GPU ativada, mas em muitos casos, mostram ganhos notáveis tanto na taxa média de quadros quanto nos 1% lows, mesmo sob alta carga da GPU.

Por Que Blackwell se Destaca?

Embora as GPUs de consumo Blackwell não pareçam ter um bloco de descompressão dedicado como suas contrapartes de datacenter, a explicação mais provável reside na adição de um Agendador Aprimorado, conhecido como Processador de Gerenciamento de IA (AMP). O AMP é um processador RISC-V dedicado, otimizado para o Windows Hardware-Accelerated GPU Scheduling (HAGS).

  • Eficiência Aprimorada: O AMP permite que a GPU gerencie suas próprias tarefas e memória de forma mais eficiente, sem depender tanto da CPU.
  • Cargas de Trabalho Assíncronas: Ele melhora o agendamento de cargas de trabalho assíncronas, como a descompressão de assets, permitindo que a GPU execute múltiplas tarefas complexas simultaneamente sem gargalos.

Essa arquitetura de agendamento mais inteligente e eficiente pode ser a chave para o desempenho superior das GPUs Blackwell, garantindo que a descompressão por GPU funcione como idealizado, proporcionando uma experiência de jogo mais fluida e imersiva.

Baseado no artigo de Tom’s Hardware