A pocos días de que se levante el embargo de las tarjetas gráficas Radeon RX serie 9070 podemos mostraros detalles de la arquitectura del chip Navi 48 y sus nuevas tecnologías. En la Radeon RX 9070 XT la Infinity Cache de tercera generación es de 64MB, el mismo tamaño que vimos en las Radeon RX 7800 XT y RX 7700 XT pero, la L2 se dobla frente a esta primera alcanzando los 8MB. Contamos también con 2MB por cada Compute Unit.
Tenemos aceleradores matrix y de trazado de rayos de tercera generación. Se añaden instrucciones FP8 y algoritmo Machine Learning para el reescalado Super Resolution. La memoria es GDDR6 de 20 Gbps como en la serie RX 7900, con un bus de 256 bits y mejora en la compresión adaptándose a llamadas de diferentes shaders para un reordenamiento más eficiente.

El chip está fabricado con tecnología de TSMC de 4 nm, tiene una superficie de 356,5 mm2 y es de tipo monolítico, AMD abandona sus planes de multichip para centrarse en GPUs más asequibles y por lo tanto la RX 9070 XT será su gama más alta en esta generación. Tienen interfaz PCIe 5.0 x16 con un motor nuevo de escalado y suavizado de bordes y, las salidas gráficas serán DisplayPort 2.1a y HDMI 2.1b.
En RDNA 4 tenemos aceleración de trazado de rayos de tercera generación con mejoras en el BVH y OBB para una mayor eficiencia en la compresión a la vez que se aumenta la tasa de interesecciones. Ambas tecnologías buscan adaptarse a la geometría limitando el volumen y rotando el cubo de definición por nodo.


El Dual Media Engine dobla el rendimiento con AV1, mejorando la eficiencia de la codificación con la referencia de fotrogramas anteriores. Con el codec H.264 se mejora un 25% la calidad de la codificación de baja latencia con streaming y con el codec H.265 la calidad aumenta un 11%. También hay mejoras con los principales programas de streaming y, el rendimiento en codificación llega hasta el 30% a 720p.

La asignación de registros de los shaders ahora es dinámica, mejorando la latencia de la memoria y el rendimiento, generando trabajo paralelo. Con trazado de rayos también se reduce la necesidad de registro en el cálculo transversal. El rendimiento geométrico llega a doblarse y el consumo relativo de memoria es un 60% del visto con RDNA 3.


Tenemos mejoras en el subsistema de memoria, CUs más eficientes y también un incremento de desempeño en sus Scalar Units con aceleradores de IA de segunda generación que doblan el rendimiento con FP16 y alcanzan el x4 con INT8, doblando estos resultados con matrices de pocos datos de impacto en cálculo. Además se incluyen instrucción FP8 más eficientes.
