Además de las mejoras en la arquitectura de memoria, que os explicaremos en las próximas páginas, NVIDIA nos explicó en detalle una mejora introducida para reducir el ancho de banda de memoria consumido al renderizar, "trucos" software/driver para ahorrar ancho de banda físico que es mucho más costoso y difícil de conseguir.

Actualmente hay dos arquitecturas de renderización tradicionales: en equipos gaming de escritorio se usa "immediate renderer" o renderizado directo, mientras que en GPUs móviles se usa "tiled rendering" o renderizado mosaico/azulejo. En el modo tradicional cada comando en la lista de lista de comandos de entrada se ejecuta hasta completarse en un orden, lo cual es una ventaja ya que solo se lee leen los datos de geometría una vez, pero en áreas con muchos píxeles solapados (overdraw), los mismos píxeles pueden ser leídos y escritos varias veces.
Con el segundo método, tiled renderer, la escena se rompe en distintos trozos/azulejos y el renderizado se hace en dos pasos. En el primer paso se procesa la geometría y se determina qué triángulos cubrirán qué azulejos y escribe dicha información en la DRAM. Luego, es un segundo paso, la lista de geometría se reprocesa por cada azulejo, azulejo a azulejo. Todo el renderizado ocurre en la GPU, solo el color final se escribe en la memoria DRAM.
Este método tiene dos limitaciones importantes comparado con el tradicional. Primero, la necesidad de una segunda pasada añade latencia y complejidad al driver, y segundo y más crítico, el ancho de banda requerido para grabar y leer la información de qué azulejos cubre qué triángulo es muy elevado en proporción a la cantidad de geometría en las escena.
NVIDIA sigue un distinto enfoque en sus GPUs Pascal y Maxwell, llamado "Tiled Caching".

Mantienen el método de renderizado directo o inmediato para los gráficos, sin segunda pasada, sin embargo, en el "pipeline" de renderizado añaden un "recolector" que escribe en la memoria L2 una cola de geometría de la GPU. Cuando los datos llenan el buffer en la L2, Pascal renderiza dicha geometría, azulejo a azulejo, hasta que la cola se ha procesado.
Esta modificación del comportamiento de dibujado/pintado, tiene el efecto de modificar el número de píxeles de trabajo para que ocupen el tamaño de la L2, mientras que de haberse hecho con una única vez se habría desbordado la capacidad de la caché. NVIDIA llama a esta técnica "Tiled Caching", que comparada con la tradicional arquitectura "tiled rendering" consigue ahorrar ancho de banda similar en cuanto a píxeles, pero sin pérdida alguna de ancho de banda debido a geometría o latencia.

Las GPUs Pasal, además, integran un nuevo método de compresión de color delta 4:1 y 8:1 sin pérdida. Esto reduce mucho la cantidad de bytes que deben ir a buscarse del frame de memoria por cada frame comparado con GPUs anteriores. El gráfico siguiente muestra los beneficios de Tiled Caching y compresión de color, y cuánto ancho de banda se requiere en los juegos modernos. Los beneficios de la compresión y el tiled caching pueden variar según el juego, pero en muchos casos la combinación de ambos llega hasta el doble de ancho de banda efectivo disponible.

En los últimos años los requerimientos gráficos se han incrementado mucho, por un lado por las altas resoluciones empleadas y por otro debido a la complejidad, que también ha aumentado mucho. Por esta razón la demanda de memoria DRAM para las GPUs no para de crecer. Los juegos modernos a 4K empiezan a no tener suficiente con 8GB de memoria, por esto la 1080 Ti tiene 11GB, lo que le permite jugar a juegos modernos hasta 5K, asegurando que tendrá memoria para futuros juegos que aumente incluso más la complejidad gráfica.
