Noticias3D
Registrarme | Recuperar password
  • Inicio(current)
  • Noticias
    • Últimas noticias
    • MÁs leÍdas
    • MÁs comentadas
    • Envia una noticia
  • Articulos
    • Todos
    • Placas base
    • Tarjetas grÁficas
    • Almacenamiento
    • F.AlimentaciÓn
    • Cajas de ordenador
    • Audio y vÍdeo
    • Gaming
    • PortÁtiles
    • GuÍas y taller
    • Memoria
    • Monitores
  • Tags
  • Drivers
  • Foro
×

Google

GIGABYTE GeForce RTX 4090 GAMING OC 24G

featured image
18 de octubre, 2022 |
Javier Martínez-Vilanova

Fabricante: GIGABYTE
Modelo: GeForce RTX 4090 GAMING OC 24G
Chip: GeForce RTX 4090 (AD 102)
Velocidad: 2535 MHz
Memoria: 24 GB GDDR6X
Conexión: PCIe 4.0 x16
Siguiente
Mostrando página 1 de 20

Novedades técnicas de la arquitectura Ada Lovelace

La llegada de la nueva generación de NVIDIA no llega exenta de polémica, cuando el fantasma de la minería de criptodivisas se disipó se esperaba una reducción de precios que finalmente no ha supuesto una vuelta a la normalidad. Con este contexto se han anunciado tres modelos GeForce RTX 40 con un RTX 4080 de 12 GB que en nuestra opinión debería haber recibido el nombre de RTX 4070, por su recorte en el bus de memoria. El precio, el consumo y el tamaño son otros puntos que han generado controversia, y es que la RTX 4090 de referencia tiene un TGP de 450W, ocupa 3 slots y el MSRP es de 1,599$, un desembolso que tras el cambio de divisa y el IVA, es prohibitivo para muchos usuarios.

Foto de la gráfica tumbada, vista lateral, de la cara de los ventiladores

Una de las novedades más destacadas es el cambio de proveedor del chip del núcleo, NVIDIA ha pasado de un core con tecnología Samsung de 8 nm a una litografía de 5 nm a medida de TSMC: el 4N. El nombre en código del chip RTX 4090 es AD 102, cuenta con 76.300 millones de transistores, un 63% más que los 28.300 millones de la GeForce RTX 3090 Ti. Los núcleos CUDA también tienen un incremento notorio, hay un 70% más frente al anterior buque insignia: el GA 102. La frecuencia turbo en el modelo de referencia es de 2,52 GHz. Podemos ver la evolución de las 3 generaciones RTX en la siguiente tabla carcaterísticas:

Características de las 3 generaciones NVIDIA GeForce

Este chip AD 102 mide 608,5 mm² y cuenta con 12 clústeres de procesamiento gráfico o GPC, 6 a cada lado de los 96 MB de caché L2, dentro de cada clúster hay 6 subclústeres para el procesamiento de texturas o TPC (un total de 72) y dentro de estos de Stream Mutliprocesors. Estos SM albergan los CUDA cores y la caché L1. Formando una interfaz de memoria de 384 bits hay 6 controladoras de memoria a cada lado, de 32 bits cada una. Hay dos núcleos para cálculos de coma flotante FP64 por SM, o lo que es lo mismo: 288 cores FP64.

Diagrama del chip AD 102

Dentro de cada GPC tenemos un motor de rasterización y 2 particiones de 8 ROPs, lo que nos lleva a un conteo de 192 ROPs, no los 176 que hemos visto en especificaciones. NVIDIA nos ha explicado que cada SM tiene 128 núcleos CUDA, lo que significaría un total de 18.432. En especificaciones vemos 16.384. Dentro de cada SM se encuentran también un núcleo RT de tercera generación, 4 núcleos Tensor de cuarta generación, 256 KB de archivo de registro y un total de 128KB L1 o memoria compartida.

Diagrama del chip AD 102

Las arquitecturas previas Turing y Ampere utilizan hardware dedicado, el Box Intersection Engine, representado en el cuadro izquierdo de la siguiente primera imagen, que acelera mediante BHV (Bounding Volume Hierarchy) para la estructura de datos en los cálculos de triangulación e intersección, liberando a los SM de las principales tareas del trazado de rayos con el cálculo de vértices o sombreado. 

Diagrama del proceso de trazado de rayos

Con la arquitectura Ada Lovelace en esta RTX 4090 se introducen el Opacity Micromap Engine y el Display Micro-Mesh Engine en el hardware dedicado al trazado de rayos de tercera generación.

  • Opacity Micromap Engine: El recorrido Alpha en el trazado de rayos hace referencia a la opacidad o transparencia de las partículas. Es una tecnología con la que liberar el gBuffer o caché para geometría acotando zonas, o lo que es lo mismo, creando micromapas que permitan al RT core ajustar niveles de opacidad de manera más eficiente. NVIDIA ha calculado en Portal RT una eficiencia de rellenado del buffer un 30% superior, con un impacto en el rendimiento (FPS) del 10%.
  • Display Micro-Mesh Engine: Esta es una tecnología para generar cálculos geométricos complejos con más eficiencia. Es una ayuda que libera hasta en 20 veces la necesidad de almacenamiento para texturas geométricas, impulsando este proceso del BVH hasta 10 veces. A un triángulo básico se le suma al procesamiento un mapa de desplazamiento que ayuda a moldear la imagen poligonal en una malla compleja con un menor cálculo poligonal. Podríamos imaginar un triángulo simple al que se le añade una dimensión más.

Ejemplo de micro-malla en la geometría de un cangrejoEsquema del motor de opacidad

El ejemplo que nos ha planteado NVIDIA es muy adecuado para escenificar el Shader Execution Reordering. El gigante verde nos proponía imaginar una fábrica con varios trabajadores ajustando tornillos, cada uno de un tipo, como ocurre con una secuencia Pipeline. Entendamos esta tecnología como lo que impulsó Henry Ford tantos años atrás, democratizando el automóvil. Es más eficiente tener a cada trabajador ajustando un tipo de tornillo en cadena.

NVIDIA ha buscado romper la rasterización tradicional, triangulando los rebotes del trazado de rayos escaneando el conjunto con una reagrupación que da un paso más allá. Es un programador que dirige en tiempo real las tareas al SM y sistemas de memoria, para ayudar a mejorar los cuellos de botella en el cálculo del trazado de rayos, aumentando la eficiencia en un 25 %.

Resumen de ganancia de rendimiento en trazado de rayos

Desde que vimos aquel trazado de rayos tan demandante en Battlefield V para la primera arquitectura RTX, Turing (GeForce serie 2000), las exigencias de esta tecnología han crecido de forma exponencial. En este primer título había 39 operaciones RT por píxel. Hoy en día, con Cyberpunk 2077 se alcanzan 635 operaciones por píxel, la exigencia ha crecido 4 veces por encima que el aumento de transistores. Con todo el conjunto de tecnologías NVIDIA estima que el rendimiento en trazado de rayos se ha doblado frente a la anterior generación.

Ganancia de rendimiento en Microsoft Flight Simulator con DLSS3

En la capturas previas tenemos el resultado de una tecnología de interpolación, algo que ya hemos podido ver en programas dedicados para crear frames mediante estimaciones con programas como RIFE, mejorando la suavidad a costa de algunos artefactos, especialmente visibles cuanto menor tasa de frames hubieran de forma nativa. Al crear fotogramas estimados por IA, NVIDIA consigue doblar el número de FPS. Esta tecnología por el momento es exclusiva de esta última arquitectura RTX 40. Incluso en situaciones con cuello de CPU, como ocurre en Microsoft Flight Simulator, DLSS3 permite generar frames sin pérdida de rendimiento.

Diagrama del proceso de trazado de rayos

En este diagrama podemos ver los nuevos procesos en el DLSS de tercera generación. Si recordáis el diagrama del chip, tras su interfaz PCIe 4.0 y su motor GigaThread veíamos 6 potentes aceleradores NVENC para codificación y el Optical Flow Accelerator, un elemento clave en esta tecnología. Permite la estimación de movimiento en tiempo real, NVIDIA entrena esta IA con sus equipos de computación para que los artefactos no se produzcan o se minimicen ante posibles problemas de correlación entre los fotogramas nativos y los generados. Si se basara tan solo en los vectores de movimiento, la información geométrica que ofrece el juego sería insuficiente para los cálculos de los efectos de trazados de rayos, por ejemplo, ofreciendo sombras imprecisas y artefactos.

Capturas de Cyberpunk con flechas marcando el flujo de vectores

NVIDIA sigue apostando por un diseño del PCB compacto, lo que le permite mejorar la refrigeración, mejorando el flujo de aire en el lado contrario de los conectores de vídeo. En las Founders Edition opta por un segundo ventilador con diseño invertido en la parte superior para succionar aire (pull), mientras que el resto de fabricantes apuesta por diseños de 3 ventiladores (todos en push empujando) para sus tarjetas gráficas refrigeradas por aire, con una apertura al final del backplate. También debemos destacar el cambio del cable de alimentación PCIe 5 y la respuesta de la entrega de energía, con un diseño más compacto y capacidad hasta 600W. Este cable de nueva generación tiene 12 pines para alimentación y 4 digitales para gestión de la entrega de energía. La respuesta en la entrega de energía es ahora más rápida, permitiendo un ajuste más preciso a la necesidad de vatios.

Foto del PCB y gráfico con la respuesta de la entrega de corriente

Páginas:
Siguiente
Mostrando página 1 de 20

Tags:Gigabyte, NVIDIA Ada Lovelace, NVIDIA GeForce RTX, Tarjetas Gráficas

Ver comentarios (8)

Últimos articulos
  • MSI Versa PRO Wireless Review: serie tope de gama inalámbrica
  • Acer Nitro V 14 AI Review: eficiencia en un equipo gaming polivalente
  • ASUS Vivobook S14 (S3407) Review: portátil muy compacto con rendimiento, autonomía y excelente calidad de construcción
  • MSI Vector 16 HX AI A2XW Review: un portátil de gama media-alta para gaming y productividad
  • GIGABYTE GS32QCA con AMD Radeon RX 9060 XT Review: una pareja bien avenida
  • GIGABYTE AMD Radeon RX 9060 XT GAMING OC 16G Review: Excelente refrigeración y rendimiento 1080p
  • Sapphire Pulse AMD Radeon RX 9060 XT Review: Rendimiento 1080p y 16 GB de VRAM a precio competitivo
  • MSI MAG CORELIQUID A15 360 Review: Buen rendimiento y gran estética con ARGB
  • ASUS ROG Zephyrus G16 2025 GU605 Review: un portátil slim para productividad y gaming
  • Corsair HX1200i Review: La cuarta revisión de una fuente digital prémium, ahora con dos cables 12V-2x6
Top articulos
  • Sapphire Pulse AMD Radeon RX 9060 XT Review: Rendimiento 1080p y 16 GB de VRAM a precio competitivo
  • ASUS ROG STRIX SCAR 18 2025 Review: un portátil con RTX 50 pensado para y por los gamers
  • Intel Core Ultra 5 235, Ultra 5 225F e i5-14400F Review: ¿equipo gaming precio rendimiento?
  • ASUS ROG Strix XG27UCG Review: Versátil monitor dual 4K y 1080p con 320 Hz
  • AORUS MASTER 16 Review: un portátil gaming con RTX 5080 que apura el peso y el tamaño al máximo
  • ASUS ROG Zephyrus G16 2025 GU605 Review: un portátil slim para productividad y gaming
  • Acer WAVE 7 Mesh Router Review: Máxima elegancia y precio competitivo
  • Intel 200S Boost Review: overclocking fácil que no viola la garantía. ¿Qué podemos esperar de él?
  • ASUS ROG STRIX SCAR 18 2025 G835LX Review: festival de especificaciones para los gamers
  • GIGABYTE AMD Radeon RX 9060 XT GAMING OC 16G Review: Excelente refrigeración y rendimiento 1080p
Compras recomendadas
  • AMD Ryzen 7 7800X3D 4.2 GHz/5 GHz
  • Samsung 990 PRO 2TB SSD PCIe 4.0 NVMe M.2
  • Gigabyte GeForce RTX­­ 4060 GAMING OC 8GB GDDR6 DLSS3
  • ASUS Dual GeForce RTX 4060 EVO OC Edition 8GB GDDR6 DLSS3
  • Samsung Galaxy S24 Ultra 12/256GB Gris Titanium Libre + Cargador
  • Zotac Gaming GeForce RTX 4070 Ti SUPER Trinity Black Edition 16GB GDDR6X DLSS3
  • MSI GeForce RTX 4080 SUPER VENTUS 3X OC 16GB GDDR6X DLSS3
Noticias 3D
  • articulos
  • drivers
  • foro
  • tags
  • contacto
  • publicidad
© Copyright 2000 - 2025 | nFinite9000 S.L. | Todos los derechos reservados | Aviso legal