in

Revisión de Nvidia Titan X 12GB – Tom’s Hardware

AxzDCVhmEmRAYEJuv26vxe 1200 80

Conoce GP102

Nota del editor: hemos actualizado el artículo para incluir medidas de potencia, calor y ruido en las páginas siete y ocho, y hemos editado nuestra conclusión para reflejar esas medidas (consulte la página 10).

Tiene una habilidad especial para negociar la libra esterlina con el yen japonés. Tiene una receta de salsa picante increíble y se distribuye en todo el mundo. Acabas de ser socio del bufete de tu suegro. Cualquiera que sea el caso, estás en ese grupo de élite que realmente no se preocupa por el dinero. Tienes la casa de la playa, el Bentley y el Bulgari. Y ahora Nvidia tiene una tarjeta gráfica para su PC de juegos: la Titan X. Está construida sobre un nuevo procesador de gráficos GP102 con 3584 núcleos CUDA, respaldado por 12 GB de memoria GDDR5X en un bus de 384 bits y ofrecido sin disculpas por $ 1200.

Antes de que se publicara un único punto de referencia, Nvidia recibió elogios por lanzar una tercera GPU basada en Pascal en otros tantos meses y críticas por subir el precio de su producto insignia, un enfoque que quemó a Intel cuando presentó el Core i7-6950X a un precio sin precedentes de $ 1700 + . Sin embargo, aquí está la cuestión: las personas que compran lo mejor de lo mejor no se ven afectadas por un impuesto al lujo progresivo. Y aquellos que en realidad hacer el dinero con sus PC paga alegremente primas por hardware capaz de acelerar sus ingresos.

Todo eso hace que nuestro tiempo con la Titan X sea un poco menos incómodo, creemos. No hay consideración del valor del día después. Paga un 70% más que el costo de una GeForce GTX 1080 por un 40% más de núcleos CUDA y un aumento del 50% del ancho de banda de la memoria. Sabíamos incluso antes de recibir una tarjeta que el rendimiento no aumentaría con el costo. Aún así, no podíamos esperar a ejecutar los puntos de referencia. ¿Titan X mejora las velocidades de cuadro a 4K lo suficiente como para satisfacer a los mariscales de campo del sillón que rápidamente llaman 1080 insuficiente para juegos de máxima calidad? Solo hay una forma de averiguarlo.

GP102: Es como GP104, excepto más grande

Con su GeForce GTX 1080, Nvidia nos presentó el procesador GP104 (Pascal de gama alta). En espíritu, esa GPU sucedió a GM204 (Maxwell de gama alta), vista por última vez en el corazón de GeForce GTX 980. Pero debido a que la arquitectura Pascal se programó para coincidir con la fabricación FinFET de 16 nm y la memoria GDDR5X más rápida, la GTX 1080 resultante no tuvo problemas para poner 30% + tasas de fotogramas promedio más altas que GTX 980 Ti y Titan X, ambas impulsadas por GM200 (Maxwell de gama ultra alta). Esto hizo que fuera fácil olvidarse del siguiente paso, sobre todo porque sabíamos que el GP100 de 15,3 mil millones de transistores (Pascal de ultra alta gama) estaba orientado a la computación y probablemente no estaba destinado al escritorio.

Ahora, por primera vez, tenemos una especie de GPU más tweener, rodeada por el procesador de gama alta de Nvidia y GP104. Este se llama GP102, y arquitectónicamente es similar al GP104, solo que más grande. Cuatro grupos de procesamiento de gráficos se convierten en seis. A su vez, 20 multiprocesadores de transmisión se convierten en 30. Y con 128 núcleos FP32 CUDA por SM, GP102 maneja hasta 3840 de los bloques de construcción programables. Sin embargo, GP102 es increíblemente complejo (está compuesto por 12 mil millones de transistores). Como medio para mejorar los rendimientos, Nvidia deshabilita dos de los SM del procesador para su Titan X, reduciendo la cuenta del núcleo CUDA de la placa a 3584. Y debido a que cada SM también alberga ocho unidades de textura, apagar dos de ellas deja 224 unidades de textura habilitadas.

La especificación de Titan X cita un reloj base de 1417 MHz, con frecuencias típicas de GPU Boost en el rango de 1531 MHz. Eso le da a la tarjeta una tasa FP32 de 10.1+ TFLOPS, que es aproximadamente un 23% más alta que la GeForce GTX 1080.

Sin duda, GP104 se habría beneficiado de una interfaz de memoria aún más amplia, particularmente en 4K. Pero el mayor potencial de sombreado / texturizado de GP102 definitivamente requiere una especie de reequilibrio. Como tal, el back-end del procesador crece para incluir 12 controladores de memoria de 32 bits, cada uno vinculado a ocho ROP y 256 KB de L2 (como con GP104), produciendo un total de 96 ROP y 3 MB de caché compartida. Esto resulta en una ruta agregada de 384 bits, que Nvidia llena con 12 GB del mismo GDDR5X de 10 Gb / s que se encuentra en GTX 1080.

El ancho de banda de memoria teórico de la tarjeta es de 480 GB / s (frente a los 320 GB / s de 1080, un aumento del 50%), aunque el rendimiento efectivo debería ser mayor después de considerar las mejoras de compresión de color delta de la arquitectura Pascal.

¿Por qué el uso continuo de la tecnología derivada de GDDR5 cuando AMD nos mostró los muchos beneficios de HBM hace más de un año? Solo podemos imaginar que durante la fase de diseño del GP102, Nvidia no estaba segura de cómo se agotaría el suministro de HBM2 y, en su lugar, jugó a lo seguro con un subsistema basado en GDDR5X. GP100 sigue siendo la única GPU en su línea con HBM2.

GPU Titán X (GP102) GeForce GTX 1080 (GP104) Titán X (GM100)
SMS 28 20 24
Núcleos CUDA 3584 2560 3072
Reloj base 1417 MHz 1607 MHz 1000 MHz
Reloj GPU Boost 1531 MHz 1733 MHz 1075 MHz
GFLOP (reloj base) 10.157 8228 6144
Unidades de textura 224 160 192
Tasa de llenado de Texel 342,9 GT / s 277,3 GT / s 192 GT / s
Tasa de datos de memoria 10 Gb / s 10 Gb / s 7 Gb / s
ancho de banda de memoria 480 GB / s 320 GB / s 336,5 GB / s
ROP 96 64 96
Caché L2 3 MB 2 MB 3 MB
TDP 250W 180W 250W
Transistores 12 mil millones 7.2 mil millones 8 mil millones
Tamaño de la matriz 471 mm² 314 mm² 601 mm²
Nodo de proceso 16 nm 16 nm 28 nm

Es interesante que Nvidia, aparentemente en el último minuto, eligió distanciar a Titan X de su familia GeForce. La página de inicio de Titan X en geforce.com llama a esta la mejor tarjeta gráfica. No es la mejor tarjeta gráfica para juegos. Más bien, “The Ultimate. Período.» Por supuesto, dado que estamos tratando con un GP104 de mayor tamaño, Titan X debería ser bueno para jugar.

Pero la decisión de la compañía de presentar Titan X en una reunión de IA organizada en Stanford demuestra que esta vez se está enfocando en el aprendizaje profundo. Con ese fin, mientras que las tasas de FP16 y FP64 son terriblemente lentas en GP104 (y, por extensión, en GP102), ambos procesadores admiten INT8 a 4: 1, produciendo 40,6 TOPS en la frecuencia base de Titan X.

MÁS: Mejores tarjetas gráficas

MÁS: Tabla de jerarquía de rendimiento de GPU de escritorio

MÁS: Todo el contenido de gráficos

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

edit

Bryophyte vs Pteridphyte – Diferencia y comparación

Relojes Longines The Longines Master Collection