in

Revisión de Nvidia Titan RTX: juegos, entrenamiento, inferencias, visualización profesional, ¡oh Dios!

cWnMTSwc6ZV4S7ApSWdDVJ 1200 80

Revisión de Nvidia Titan RTX

El lanzamiento de Titan RTX fue decididamente poco ceremonioso. Los miembros de la prensa tecnológica sabían que llegaría la tarjeta, pero no recibieron una para probar. Sin duda, Nvidia sabía que su mensaje se vería oscurecido por las comparaciones entre Titan RTX y la otra tarjeta basada en TU102, GeForce RTX 2080 Ti, en los juegos. Basado en un procesador TU102 completo, Titan RTX estaba destinado a ser más rápido que GeForce en todos los puntos de referencia, independientemente de la disciplina. Sin embargo, su deslumbrante precio de $ 2,500 sería difícil de justificar solo para entretenimiento.

Pero incluso cuando los jugadores reflexionan sobre el efecto de cuatro multiprocesadores de transmisión adicionales en sus velocidades de cuadro, todos sabemos que Titan RTX no estaba destinado a esa gente. Por supuesto, todavía lo vamos a ejecutar a través de nuestro conjunto de puntos de referencia de juegos. Sin embargo, Nvidia dice que esta tarjeta fue diseñada para «investigadores de inteligencia artificial, desarrolladores de aprendizaje profundo, científicos de datos, creadores de contenido y artistas».

Los participantes en esos segmentos con bolsillos especialmente profundos a menudo buscan plataformas basadas en Tesla o tarjetas Quadro con controladores certificados. Sin embargo, esos no siempre son necesarios. Como resultado, los profesionales “sensibles a los costos” que trabajan en tiendas más pequeñas se encuentran en algún punto intermedio, necesitando más que una GeForce pero no pueden gastar $ 6,300 en una Quadro RTX 6000 equivalente.

Por necesidad, nuestro conjunto de pruebas se está expandiendo para incluir visualización profesional y métricas de aprendizaje profundo, además del análisis de consumo de energía que nos gusta realizar. Prepárate para un enfrentamiento a tres bandas entre Titan RTX, Titan V y Titan Xp (con un poco de GeForce RTX 2080 Ti).

Conozca Titan RTX: comienza con un TU102 completo

La audiencia de Tom’s Hardware ya debería estar familiarizada con la GPU TU102 de Nvidia: es el motor en el corazón de GeForce RTX 2080 Ti, compuesto por 18,6 mil millones de transistores y que mide 754 milímetros cuadrados.

Sin embargo, como aparece en el 2080 Ti, TU102 presenta 68 multiprocesadores de transmisión activos. Cuatro de los 72 del chip están apagados. Uno de sus controladores de memoria de 32 bits también está desactivado, lo que lleva consigo ocho ROP y 512 KB de caché L2.

Titan RTX se basa en el mismo procesador, pero con cada bloque activo. Eso significa que la tarjeta cuenta con una GPU con 72 SM, 4,608 núcleos CUDA, 576 núcleos Tensor, 72 núcleos RT, 288 unidades de textura y 36 motores PolyMorph.

Titan RTX no solo tiene más núcleos CUDA que GeForce RTX 2080 Ti, sino que también ofrece una clasificación de reloj GPU Boost más alta (1,770 MHz frente a 1,635 MHz). Como tal, su tasa máxima de precisión simple aumenta a 16,3 TFLOPS.

Cada SM también contiene un par de núcleos CUDA con capacidad FP64, lo que produce una tasa de doble precisión que es 1/32 del rendimiento FP32 de TU102, o 0,51 TFLOPS. Esta es un área en la que Titan RTX pierde mucho con su predecesor. El procesador GV100 de Titan V es mejor en el espacio HPC gracias al rendimiento FP64 máximo de 6,9 ​​TFLOPS (la mitad de su tasa de precisión simple). Un análisis rápido del benchmark aritmético Sandra GPGPU de SiSoftware confirma la fortaleza de Titan V, junto con el soporte de precisión mixta inherente a Turing y Volta, del cual Pascal carece.

Las GPC de la GPU son alimentadas por 12 controladores de memoria GDDR6 de 32 bits, cada uno conectado a un clúster de ocho ROP y 512 KB de caché L2, lo que genera un bus de memoria agregado de 384 bits, 96 ROP y un caché L2 de 6 MB. A la misma velocidad de datos de 14 Gb / s, una ubicación de memoria adicional compra a Titan RTX aproximadamente un 9% más de ancho de banda de memoria que GeForce RTX 2080 Ti.

Titán RTX GeForce RTX 2080 Ti FE Titán V Titán Xp
Arquitectura (GPU) Turing (TU102) Turing (TU102) Volta (GV100) Pascal (GP102)
Núcleos CUDA 4608 4352 5120 3840
Computación pico FP32 16.3 TFLOPS 14.2 TFLOPS 14,9 TFLOPS 12.1 TFLOPS
Núcleos de tensor 576 544 640 N / A
Núcleos RT 72 68 N / A N / A
Unidades de textura 288 272 320 240
Frecuencia de reloj base 1350 MHz 1350 MHz 1200 MHz 1,404 MHz
Tasa de aumento de GPU 1.770 MHz 1,635 MHz 1455 MHz 1,582 MHz
Capacidad de memoria GDDR6 de 24 GB GDDR6 de 11 GB 12 GB HBM2 GDDR5X de 12 GB
Bus de memoria 384 bits 352 bits 3,072 bits 384 bits
ancho de banda de memoria 672 GB / s 616 GB / s 653 GB / s 547,7 GB / s
ROP 96 88 96 96
Caché L2 6 MB 5,5 MB 4,5 MB 3 MB
TDP 280W 260W 250W 250W
Recuento de transistores 18,6 mil millones 18,6 mil millones 21,1 mil millones 12 mil millones
Tamaño de la matriz 754 mm² 754 mm² 815 mm² 471 mm²
Soporte SLI Sí (x8 NVLink, x2) Sí (x8 NVLink, x2) No Sí (MIO)

Mientras que GeForce RTX 2080 Ti Founders Edition utiliza los módulos MT61K256M32JE-14: A de Micron, la empresa no tiene circuitos integrados de 16 Gb en su catálogo de piezas. Samsung, por otro lado, ofrece un módulo K4ZAF325BM-HC14 de mayor densidad con una velocidad de datos de 14 Gb / s. Doce de ellos le dan a Titan RTX su capacidad de 24 GB y su rendimiento máximo de 672 GB / s.

Mucha memoria adicional, una GPU con más recursos activos y velocidades de reloj más rápidas requieren una clasificación de potencia de diseño térmico más alta. Mientras que GeForce RTX 2080 Ti Founders Edition se especifica en 260W, Titan RTX es una tarjeta de 280W. Ese aumento de 20W no es un problema para el par de conectores de alimentación auxiliar de ocho pines que se encuentran en el borde superior, ni tampoco un desafío para la fuente de alimentación y la solución térmica de Nvidia, las cuales parecen idénticas a su GeForce RTX 2080 Ti.

Al igual que la 2080 Ti Founders Edition, contamos tres fases para la memoria GDDR6 de Titan RTX y un controlador PWM correspondiente en la parte delantera. Quedan un total de 13 fases. Los conectores de ocho pines alimentan cinco fases y se duplican. Con dos lazos de control por fase, 5 * 2 = 10 circuitos de regulación de voltaje. Las tres fases restantes a la izquierda de la GPU son alimentadas por la ranura PCIe de la placa base y no se duplican. Eso nos da el número 13 de la suerte de Nvidia (junto con un esquema de distribución de carga inteligente). Por supuesto, implementar todo esto bien requiere los componentes correctos …

Al frente y al centro de este diseño se encuentra el controlador reductor de ocho fases uP9512 de uPI diseñado específicamente para admitir GPU de próxima generación. Por uPI, «el uP9512 proporciona voltaje de salida programable y funciones de posicionamiento de voltaje activo para ajustar el voltaje de salida en función de la corriente de carga, por lo que está posicionado de manera óptima para una corriente de carga transitoria».

El uP9512 es compatible con la tecnología de regulador de voltaje abierto Tipo 4i + de Nvidia con PWMVID. Esta entrada se almacena en búfer y se filtra para producir un voltaje de referencia muy preciso. Luego, la tensión de salida se controla con precisión a la entrada de referencia. Una interfaz SMBus integrada ofrece suficiente flexibilidad para optimizar el rendimiento y la eficiencia, al mismo tiempo que facilita la comunicación con el software adecuado. Los 13 circuitos de regulación de voltaje están equipados con un módulo de etapa de potencia inteligente ON Semiconductor FDMF3170 con MOSFET PowerTrench integrados y circuitos integrados de controlador.

Los circuitos integrados de memoria K4ZAF325BM-HC14 de Samsung funcionan con tres fases que provienen de un segundo uP9512. Los mismos módulos FDMF3170 Smart Power Stage vuelven a aparecer. Las bobinas de 470 mH ofrecen una mayor inductancia que las que se encuentran en las fases de potencia de la GPU, pero son completamente idénticas en términos de dimensiones físicas.

Debajo del capó, la solución térmica de Titan RTX también es la misma que encontramos en GeForce RTX 2080 Ti. Una cámara de vapor de longitud completa cubre la PCB y está rematada con una pila de aletas de aluminio. Una cubierta sobre el disipador de calor alberga dos ventiladores axiales de 8,5 cm con 13 aspas cada uno. Estos ventiladores soplan a través de las aletas y extraen el calor residual por los bordes superior e inferior de la tarjeta. Aunque no nos gusta necesariamente que Nvidia recircule el aire caliente con sus enfriadores de referencia basados ​​en Turing, su rendimiento es ciertamente superior a las configuraciones de estilo de soplador más antiguas.

La placa posterior de Titan RTX no es solo por apariencia. Nvidia incorpora la placa en su concepto de enfriamiento intercalando almohadillas térmicas entre el metal y la PCB, detrás de donde se encuentran los módulos de memoria en la parte delantera. Sin embargo, la compañía probablemente podría haberlo hecho sin la almohadilla debajo de TU102: nuestras medidas no mostraron diferencias cuando la quitamos.

No debería sorprender que la misma PCB, los mismos componentes, el mismo enfriador y las mismas dimensiones produzcan una tarjeta con el mismo peso que la GeForce RTX 2080 Ti también. Nuestro Titan RTX registra 2 libras. 14.6 oz. (1.322 kg) en una balanza. Incluso la pegatina en la parte posterior de Titan RTX dice GeForce RTX 2080 Ti. Nvidia diferencia la tarjeta estéticamente con un acabado dorado mate (en lugar de plateado), con detalles en oro pulido alrededor de los ventiladores y la cubierta. Un logotipo de Titán dorado brillante en el borde superior se ilumina en blanco cuando se enciende.

Cómo probamos Titan RTX

Benchmarking Titan RTX es un poco más complejo que una tarjeta gráfica de juego típica. Debido a que ejecutamos cargas de trabajo de visualización profesional, aprendizaje profundo y juegos, terminamos utilizando múltiples máquinas para satisfacer los requisitos de esas aplicaciones dispares.

Para facilitar las pruebas de aprendizaje profundo, configuramos una CPU Core i7-8086K (6C / 12T) en una placa base Gigabyte Z370 Aorus Ultra Gaming. Las cuatro ranuras de memoria se completaron con módulos Corsair Vengeance LPX de 16 GB en DDR4-2400, lo que nos da un total de 64 GB. Luego, cargamos Ubuntu 18.04 LTS en un Intel SSD DC P3700 de 1.6TB. Titan RTX se compara con Titan V, Titan Xp y GeForce RTX 2080 Ti en estos puntos de referencia.

Para una visualización profesional, configuramos una CPU Core i7-8700K (6C / 12T) en una placa base MSI Z370 Gaming Pro Carbon AC. Nuevamente, las cuatro ranuras de memoria se completaron con módulos Corsair Vengeance LPX de 16 GB en DDR4-2400, lo que nos da un total de 64 GB. Luego, cargamos Windows 10 Professional en una unidad Intel SSD serie 750 de 1.2TB. Por cierto, este es el mismo sistema que ejecuta nuestro software Powenetics para medir el consumo de energía. Titan RTX se compara con Titan V, Titan Xp y GeForce RTX 2080 Ti en estos puntos de referencia.

Finalmente, recopilamos resultados de juegos en el mismo Core i7-7700K utilizado en revisiones anteriores. Llena una placa base MSI Z170 Gaming M7, que también aloja el kit de memoria F4-3000C15Q-16GRR de G.Skill. El SSD MX200 de Crucial permanece, junto con un Intel DC P3700 de 1.6TB cargado de juegos. Titan RTX se compara con Aorus GeForce RTX 2080 Ti Xtreme 11G de Gigabyte, GeForce RTX 2080 Ti Founders Edition, Titan V, GeForce RTX 2080, GeForce RTX 2080, GeForce GTX 1080 Ti, Titan X, GeForce GTX 1070 Ti, GeForce GTX 1070, Radeon RX Vega 64 y Radeon RX Vega 56 en estos puntos de referencia.

Todas esas tarjetas se prueban a 2560×1440 y 3840×2160 en Cenizas de la singularidad: Escalada, Campo de batalla v, Destiny 2, Far Cry 5, Forza Motorsport 7, Grand Theft Auto V, Metro: Last Light Redux, Rise of the Tomb Raider, la división de Tom Clancy, Tom Clancy’s Ghost Recon Wildlands, El brujo 3 y Wolfenstein II: El nuevo coloso.

Invitamos a AMD a enviar un producto más orientado a la computación para nuestro aprendizaje profundo y pruebas de estaciones de trabajo. Sin embargo, los representantes de la empresa no respondieron después de analizar inicialmente la solicitud. Afortunadamente, deberíamos tener Radeon VII para probar muy pronto.

La metodología de prueba que estamos usando proviene de PresentMon: Performance In DirectX, OpenGL y Vulkan. En resumen, estos juegos se evalúan utilizando una combinación de OCAT y nuestra propia GUI interna para PresentMon, con registro a través de GPU-Z.

A medida que generamos nuevos datos, usamos los controladores más recientes. Para Linux, eso significó usar 415.18 para Titan RTX y Titan V, y luego 410.93 para Titan Xp. En Windows 10, optamos por el controlador de prensa 417.26 de Nvidia para Titan RTX, 417.22 para la tarjeta Gigabyte, 416.33 para GeForce RTX 2070 y 411.51 para 2080/2080 Ti FE. Las placas antiguas basadas en Pascal se probaron con la compilación 398.82. Los resultados de Titan V se comprobaron al azar con 411.51 para garantizar que el rendimiento no cambiara. Las tarjetas de AMD utilizan Crimson Adrenalin Edition 18.8.1 (excepto para Campo de batalla v y Wolfenstein pruebas, que se prueban con Adrenalin Edition 18.11.2).

Un agradecimiento especial a Noctua por enviar un lote …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

edit

Video compuesto vs S-video: diferencia y comparación

Relojes Bulgari Octo en Venta