Saltar al contenido

Nvidia GeForce GTX 460: La Fermi que estábamos esperando

octubre 16, 2021
PvhjQ63Aa2xrkMoKZqqYum 1200 80

GeForce GTX 460 de 1 GB y 768 MB

Nota del editor: Como parte del lanzamiento de GeForce GTX 460, tenemos 20 claves Just Cause 2 para Steam. ¡Asegúrese de leer hasta la última página de esta revisión para conocer los detalles del concurso y el enlace para participar!

“Honestamente, no estoy seguro de qué estaba pensando Nvidia con este. Seguramente, su equipo de análisis competitivo ejecutó estos mismos puntos de referencia y encontró que la GeForce GTX 465 y la Radeon HD 5830 eran golpes comerciales. Seguramente, el mismo grupo de personas se conectó y vio que las Radeon HD 5830 se vendían por $ 220, hasta $ 199 con reembolsos. ¿Cómo, entonces, decidieron que $ 279 era un buen punto de partida para los precios sugeridos? «

Esa fue la conclusión a la que llegué después de pasar una semana con la GeForce GTX 465 de Nvidia. Yo también tenía razón.

Nvidia me está insistiendo en ese párrafo hoy con un par de nuevas tarjetas que logran lo que la 465 no pudo. La GeForce GTX 460 de 1 GB y la GeForce GTX 460768 MB ofrecen mucho mejor valor.

Después de ver tres tarjetas (GTX 480, 470 y 465) centradas en el procesador de gráficos GF100, finalmente tienen una parte derivada verdadera llamada GF104. Nvidia podría haber cortado muy bien GF100 a la mitad para el lanzamiento de la GeForce GTX 460, produciendo una parte con 256 núcleos de sombreado, 32 unidades de textura y un bus de memoria de 192 bits. Habría funcionado bastante bien, y habría sido un paso evolutivo hacia abajo de la GTX 465 con 352 sombreadores, 44 unidades de textura y un bus de 256 bits. Sin embargo, tal parte habría tenido que enfrentarse a la Radeon HD 5770 de AMD en el mejor de los casos.

En cambio, estamos viendo un chip rediseñado que emplea la arquitectura Fermi, pero tiene una disposición diferente de recursos y aproximadamente dos tercios de la complejidad del GF100, lo que lo convierte en un chip más pequeño, de funcionamiento más fresco y, lo crea o no, más funcional (así es, esta nueva GPU incluye un procesador de video actualizado capaz de transmitir pistas de sonido Dolby TrueHD y DTS-HD Master Audio de películas Blu-ray). Esta es una segunda puñalada mucho más potente de la Radeon HD 5830.

Procesador de gráficos GF104 de Nvidia

Como verá en los puntos de referencia, GeForce GTX 460 es más rápida que GeForce GTX 465 en un gran número de pruebas. Pero, ¿cómo es posible esto desde una GPU con menos núcleos de sombreado, una GPU diseñada para ser más convencional que los tres mil millones de transistores GF100?

Todo se debe a una reordenación de recursos.

A nivel macro, GF104 todavía se centra en el concepto de grupos de procesamiento de gráficos (GPC), cada uno de los cuales contiene cuatro multiprocesadores de transmisión (SM).

Imagen 1 de 2

GF100 SM

Imagen 2 de 2

GF104 SM

Sin embargo, las cosas comienzan a cambiar dentro del SM. En lugar de los 32 núcleos CUDA del GF100 por SM, GF104 maneja 48 núcleos por SM. Mantener estos SM más complejos alimentados con información requiere un mayor rendimiento de instrucciones, por lo que vemos otra mejora: llevar las dos unidades de despacho de GF100 por SM a las cuatro de GF104. Del mismo modo, cada SM ahora cuenta con ocho unidades de textura (en lugar de cuatro).

En los términos más simples posibles, esta es una GPU más ancha que la GF100. El resultado es un mejor rendimiento que un GF100 reducido en los tipos de aplicaciones que la mayoría de la gente juega en la actualidad.

Completa GF104

Ahora, hagamos algunos cálculos rápidos para determinar con qué estamos trabajando aquí. A completa GF104 (sin ningún recurso desactivado), emplea dos GPC. Dados cuatro SM por GPC, estás viendo ocho SM. Con el conocimiento de que hay 48 núcleos por SM, GF104 puede aprovechar hasta 384 núcleos CUDA, 64 unidades de textura y ocho motores PolyMorph, que Nvidia utiliza para escalar el rendimiento de la geometría.

Completa GF100

El back-end del chip también es un poco diferente. Un GF100 completo ofrece seis unidades de partición ROP independientes de los GPC, cada una capaz de generar ocho píxeles enteros de 32 bits por reloj (un total de 48). Las seis particiones también están asociadas con una ruta de memoria de 64 bits, lo que produce un bus agregado de 384 bits. GF104 obtiene un máximo de cuatro particiones, con un rendimiento de hasta 32 píxeles por reloj y un bus de 256 bits.

Bastante impresionante para un chip que todavía se fabrica a 40 nm y está compuesto por menos de dos mil millones de transistores, ¿verdad? Aunque quizás no sea tan impresionante como lo que AMD ha hecho con su Cypress de dos mil millones de transistores, tendremos que revisar los puntos de referencia para obtener más información allí.

close