A través de TechPowerUp leemos que la página web de Chips and Cheese se ha dedicado a analizar la latencia del sistema de memoria de las actuales tarjetas gráficas de AMD y NVIDIA, aparte de luego expandir pruebas a otras generaciones.
Para medir esto han realizado un sencillo programa con OpenCL que da las mediciones de lo que tarda en responder el sistema de memoria y ahí entra en acción los distintos niveles de caché de ambas tarjetas que tienen unas aproximaciones muy distintas.
Para las pruebas se ha utilizado una Radeon RX 6800 XT que tiene muchos niveles de caché: L0 de 32 KB, L1 de 128 KB, L2 de 4 MB y L3 de 128 MB (conocida comercialmente como Infinity cache). Por la parte de NVIDIA encontramos una GeForce RTX 3090 que cuenta con: L1 de 128 KB y L2 de 6 MB.
Y el resultado a con distintos tamaños es el siguiente:

En la gráfica podemos ver que si bien la Ampere empieza con mejores resultados una vez hay que recurrir a un siguiente nivel de caché hay una buena pérdida de rendimiento, mientras que la curva de AMD se mantiene mucho más plana y al final, con peticiones de 1 GB terminan con una latencia muy similar.
El salto de un "miss" de la caché L1 hasta la L2 en NVIDIA implica perder unos 100 ns, en cambio con la solución de AMD el salto de la L0 hasta la L2, que son dos "miss" sólo implica perder 66 ns.
De todo ello llegan a las conclusiones de que AMD gestiona mejor las latencias de su sistema de memoria ya que incluso teniendo más niveles de caché, y por lo tanto más "miss", en las peticiones consigue mantener el tipo respecto al sistema de memoria de NVIDIA, que parece verse perjudicado por un chip monolítico más grande donde las peticiones tardan más en llegar, además de una velocidad de reloj del núcleo inferior.
Aparte de este aspecto, la excelente latencia con peticiones que entran dentro de los primeros 128 MB demuestran la eficacia de la Infinity Caché, y sería una de las explicaciones de porqué AMD planta cara a su rival a bajas resoluciones y en cambio a 4K las soluciones RDNA2 pierden fuelle.
En algunas interpretaciones de los resultados por parte de varias webs que se hacen eco de estas pruebas se hace la suposición de que AMD estaría mejor preparada para ofrecer gráficas en forma de chiplets capaces de plantar cara a las soluciones monolíticas actuales en cuanto a latencias se refiere, veremos qué ocurre en el futuro.
Chips and Cheese también realiza algunas pruebas de latencia de memorias con tarjetas de generaciones anteriores y en todos los casos vemos cómo ambos fabricantes han ido reduciendo las latencias a cada generación aunque en el caso de AMD esto es más evidente:

