in

Revisión de Nvidia GeForce GTX 1660 Ti 6GB: Turing sin RTX – Tom’s Hardware

BzhGd5ZDvuZSrNGraJZ2kM 1200 80

Turing sin el RTX

21/11/2019 Actualización: Desde el lanzamiento de la GTX 1660 Ti en febrero de 2019, el panorama de la GPU ha cambiado drásticamente, con una franja de tarjetas «Super» basadas en la misma arquitectura de Turing, pero con un rendimiento más alto y precios más bajos que la línea Turing inicial de la compañía. Lo más relevante para los compradores potenciales de la GTX 1660 Ti es el GeForce GTX 1660 Super, que ofrece un rendimiento similar al 1660 Ti, a un precio inicial más bajo de $ 229. En el momento de escribir este artículo, eso es aproximadamente $ 30 menos que la GTX 1660 Ti de menor precio.

Nvidia GeForce GTX 1660 Ti se basa en TU116, un procesador de gráficos completamente nuevo que incorpora los sombreadores mejorados de Turing, su arquitectura de caché unificada, soporte para sombreado adaptativo y un complemento completo de funciones de aceleración de codificación / decodificación de video. La GPU está emparejada con la memoria GDDR6, al igual que los modelos de la serie GeForce RTX 20 de gama alta. Pero no es lo suficientemente rápido como para justificar agregar núcleos RT para el trazado de rayos acelerado o núcleos Tensor para inferencias en juegos. Como resultado, TU116 es un chip más delgado con una lista de especificaciones que enfatiza los títulos más importantes de la actualidad.

La versión de EVGA de la GeForce GTX 1660 Ti

Nvidia dice que GeForce GTX 1660 Ti comenzará en $ 280 y reemplazará completamente a GeForce GTX 1060 6GB. Aunque ese precio base es $ 30 (o 12 por ciento) más alto que donde el 1060 6GB basado en Pascal comenzó su viaje en 2016, la compañía afirma que la GeForce GTX 1660 Ti es hasta 1.5 veces más rápida y con la misma potencia nominal de 120W. no menos.

El rendimiento mejorado por dólar no es algo que hayamos visto mucho en la generación Turing hasta ahora. ¿Puede Nvidia cambiar eso con una GPU más diseñada específicamente para un rendimiento de 1920 x 1080?

Conozca TU116: Turing Sans RT y Tensor Cores

Hemos visto a Nvidia lanzar cuatro GPU separadas mientras nos escolta por la jerarquía de Turing. Con cada uno, la empresa desprende recursos para apuntar a puntos de precios más bajos. Pero sabemos que está tratando de mantener el equilibrio en el camino, minimizando los cuellos de botella que robarían innecesariamente a los procesadores de gama baja su máximo rendimiento.

GeForce RTX 2060 está equipada con 44 por ciento de los núcleos CUDA y unidades de textura de 2080 Ti, 54 por ciento de sus ROP y ancho de banda de memoria, y 50 por ciento de su caché L2. Antes del lanzamiento de 2060, sospechábamos que lujos como los núcleos RT y Tensor ya no tendrían sentido en esos niveles. Pero una serie de parches para Campo de batalla v—El juego habilitado para el trazado de un rayo disponible en ese momento— permitió grandes ganancias de rendimiento, lo que demuestra que las características distintivas de Turing aún se pueden utilizar a velocidades de cuadro jugables.

Resulta que estábamos desviados por un nivel. Nvidia considera que TU116 es el límite donde la potencia de sombreado cae lo suficientemente bajo como para evitar que las capacidades de futuro de Turing sirvan para muchos propósitos. Después de quitar los núcleos RT y Tensor, nos queda un chip de 284 mm² compuesto por 6.600 millones de transistores fabricados mediante el proceso FinFET de 12 nm de TSMC. Pero a pesar de sus transistores más pequeños, TU116 sigue siendo un 42 por ciento más grande que el procesador GP106 que lo precedió.

Parte del crecimiento se puede atribuir a los sombreadores más sofisticados de Turing. Al igual que las tarjetas de la serie GeForce RTX 20 de gama alta, GeForce GTX 1660 Ti admite la ejecución simultánea de instrucciones aritméticas FP32, que constituyen la mayoría de las cargas de trabajo de sombreado, y operaciones INT32 (para direccionar / obtener datos, min / max de punto flotante, comparar, etc. .). Cuando escuche que los núcleos de Turing logran un mejor rendimiento que Pascal a una frecuencia de reloj determinada, esta capacidad explica en gran medida por qué.

Los multiprocesadores de transmisión por secuencias de Turing están compuestos por menos núcleos CUDA que los de Pascal, pero el diseño lo compensa en parte al distribuir más SM en cada GPU. La arquitectura más nueva asigna un programador a cada conjunto de 16 núcleos CUDA (2x Pascal), junto con una unidad de envío por cada 16 núcleos CUDA (igual que Pascal). Cuatro de esos grupos de 16 núcleos comprenden el SM, junto con 96 KB de caché que se pueden configurar como memoria compartida de 64 KB L1 / 32 KB o viceversa, y cuatro unidades de textura. Debido a que Turing duplica los programadores, solo necesita emitir una instrucción a los núcleos CUDA cada dos ciclos de reloj para mantenerlos llenos. En el medio, es gratis emitir una instrucción diferente a cualquier otra unidad, incluidos los núcleos INT32.

Imagen 1 de 2

El TU116 SM, con núcleos FP16

Imagen 2 de 2

Un TU102 / TU104 / TU106 SM con núcleos Tensor / RT

Específicamente en TU116, Nvidia dice que reemplaza los núcleos Tensor de Turing con 128 núcleos FP16 dedicados por SM, que permiten que GeForce GTX 1660 Ti procese operaciones de precisión media al doble de la velocidad de FP32. Sin embargo, las otras GPU basadas en Turing también cuentan con FP16 de doble velocidad, por lo que no está claro cómo la GeForce GTX 1660 Ti es única dentro de su familia. Más obvio, según el cuadro a continuación, es que la 1660 Ti ofrece una mejora masiva en el rendimiento de precisión media en comparación con GeForce GTX 1060 y su chip GP106 basado en Pascal.

Pero cuando ejecutamos el módulo de análisis científico de Sandra, que prueba las multiplicaciones de la matriz general, vemos cuánto más rendimiento FP16 logran los núcleos Tensor de TU106 en comparación con TU116. GeForce GTX 1060, que solo admitía FP16 simbólicamente, apenas se registra en la tabla.

Además de los sombreadores de la arquitectura de Turing y la caché unificada, TU116 también admite un par de algoritmos denominados Sombreado adaptable al contenido y Sombreado adaptable al movimiento, que en conjunto se denominan Sombreado de velocidad variable. Cubrimos esta tecnología en la arquitectura Turing explorada de Nvidia: dentro de la GeForce RTX 2080. Esa historia también presentó las capacidades de codificación y decodificación de video acelerado de Turing, que también se transfieren a GeForce GTX 1660 Ti.

Poniendolo todo junto…

Nvidia empaqueta 24 SM en TU116, dividiéndolos entre tres clústeres de procesamiento de gráficos. Con 64 núcleos FP32 por SM, son 1536 núcleos CUDA y 96 unidades de textura en toda la GPU. Los socios de la junta, sin duda, apuntarán a un rango de frecuencias para llenar el vacío entre GTX 1660 Ti y RTX 2060. Sin embargo, la frecuencia de reloj base oficial es de 1.500 MHz con una especificación GPU Boost de 1.770 MHz. Nuestra muestra EVGA GeForce GTX 1660 Ti XC Black Gaming superó alrededor de 1.845 MHz a través de tres corridas de Última luz del metro, mientras que otras tarjetas que hemos visto superan fácilmente los 2.000 MHz. En papel, entonces, GeForce GTX 1660 Ti ofrece hasta 5.4 TFLOPS de rendimiento FP32 y 10.9 TFLOPS de rendimiento FP16.

Seis controladores de memoria de 32 bits dan a TU116 un bus agregado de 192 bits, que está poblado por módulos GDDR6 de 12 Gb / s (Micron MT61K256M32JE-12: A) que alcanzan los 288 GB / s. Eso es un 50% más de ancho de banda de memoria que el que obtiene la GeForce GTX 1060, lo que ayuda a la GeForce GTX 1660 Ti a mantener su ventaja de rendimiento en 2560 x 1440 con el suavizado habilitado.

Cada controlador de memoria está asociado con ocho ROP y un segmento de 256 KB de caché L2. En total, TU116 expone 48 ROP y 1,5 MB de L2. El recuento de ROP de GeForce GTX 1660 Ti se compara favorablemente con RTX 2060, que también utiliza 48 salidas de renderizado. Pero sus porciones de caché L2 son la mitad de grandes.

A pesar de un dado más grande, un conteo de transistores 50% más alto y una frecuencia de reloj GPU Boost más agresiva, la GeForce GTX 1660 Ti está clasificada para los mismos 120W que la GeForce GTX 1060. Desafortunadamente, ninguna de las tarjetas gráficas incluye soporte para múltiples GPU. Nvidia continúa impulsando la narrativa de que SLI está destinado a impulsar un mayor rendimiento absoluto, en lugar de brindar a los jugadores una forma de igualar las configuraciones de una sola GPU.

EVGA GeForce GTX 1660 Ti XC Negro para juegos GeForce RTX 2060 FE GeForce GTX 1060 FE GeForce GTX 1070 FE
Arquitectura (GPU) Turing (TU116) Turing (TU106) Pascal (GP106) Pascal (GP104)
Núcleos CUDA 1536 1920 1280 1920
Computación pico FP32 5.4 TFLOPS 6.45 TLFOPS 4.4 TFLOPS 6.5 TFLOPS
Núcleos de tensor N / A 240 N / A N / A
Núcleos RT N / A 30 N / A N / A
Unidades de textura 96 120 80 120
Frecuencia de reloj base 1500 MHz 1365 MHz 1506 MHz 1506 MHz
Tasa de aumento de GPU 1770 MHz 1680 MHz 1708 MHz 1683 MHz
Capacidad de memoria GDDR6 de 6 GB GDDR6 de 6 GB GDDR5 de 6 GB GDDR5 de 8 GB
Bus de memoria 192 bits 192 bits 192 bits 256 bits
ancho de banda de memoria 288 GB / s 336 GB / s 192 GB / s 256 GB / s
ROP 48 48 48 64
Caché L2 1,5 MB 3 MB 1,5 MB 2 MB
TDP 120W 160W 120W 150W
Recuento de transistores 6,6 mil millones 10,8 mil millones 4.4 mil millones 7.2 mil millones
Tamaño de la matriz 284 mm² 445 mm² 200 mm² 314 mm²
Soporte SLI No No No Sí (MIO)

GeForce GTX 1660 Ti XC Black Gaming de EVGA

La GeForce GTX 1060 Founders Edition también era una tarjeta de 120W y pasaba chirriando con un conector auxiliar de seis pines. La GeForce GTX 1660 Ti XC Black Gaming de EVGA, por otro lado, emplea una entrada de ocho pines, lo que le da un poco de margen adicional. Como veremos en nuestra prueba de potencia por carril, la tarjeta consume 3 A de corriente a través de su ranura PCIe durante nuestra prueba de esfuerzo; el resto proviene de su conector de ocho pines.

EVGA utiliza cuatro fases de potencia para TU116. Las fases de la GPU están controladas por un ON Semiconductor NCP81276 más antiguo en la parte posterior de la PCB, que está conectado a un cuarteto de ON Semiconductor NCP302155.

Esos cuatro componentes integran los MOSFET de lado alto y bajo, un controlador y el diodo de arranque. Son las mismas partes que se usan en GeForce RTX 2070 Founders Edition, capaces de corrientes promedio de hasta 55A.

El conocido uP1666Q de doble fase de Ubiq Semiconductor controla los circuitos de regulación de voltaje de la memoria a través de dos MOSFET de doble canal N QM3816N6.

Más interesante que la fuente de alimentación bastante simple de la GeForce GTX 1660 Ti XC Black Gaming, quizás, es el hecho de que la PCB de EVGA tiene almohadillas vacías para dos fases de GPU adicionales. También hay un par de ubicaciones para dos módulos de memoria GDDR6 más. Nvidia hizo algo similar con GeForce GTX 1060, dejando un par de espacios en blanco en su tarjeta Founders Edition que nunca se llenaron. Esta es una medida que ahorra tiempo y dinero, que permite a la empresa utilizar una placa de circuito impreso para varios productos.

Una placa de metal se encuentra en la parte superior de la PCB, intercalando almohadillas térmicas entre el controlador / MOSFET integrado, los módulos de memoria GDDR6 y la resistencia de detección de corriente. Más almohadillas térmicas en la parte superior de la placa mantienen el calor moviéndose hacia el ensamblaje del disipador principal, que se monta alrededor de la GPU en cuatro puntos y se atornilla a través de la parte posterior de la PCB.

La solución térmica en sí está compuesta por una almohadilla de cobre bastante delgada que hace contacto directo con TU116. Tres tubos aplanados se sueldan a la parte superior y una serie de aletas de aluminio, a su vez, se sueldan a los tubos de calor. Una pila de aletas relativamente gruesa se ve exagerada por la cubierta, que alberga un solo ventilador de 85 mm y agrega aún más profundidad. En total, la GeForce GTX 1660 Ti XC Black Gaming de EVGA ocupa tres ranuras de expansión en su placa base.

EVGA termina intercambiando grosor por longitud. La GeForce GTX 1660 Ti XC Black Gaming puede tener 2 ”de profundidad, pero solo mide aproximadamente 7.5” (~ 190 mm) de largo y 4 ⅜ ”(111 mm) de alto. Además, en comparación con las robustas tarjetas Founders Edition que hemos estado revisando, un peso total de 1 libra 7 oz. (656g) se siente francamente ligero.

En la parte delantera, la GeForce GTX 1660 Ti XC Black Gaming expone un conector DVI de doble enlace, un puerto HDMI y una interfaz DisplayPort. El conector VirtualLink basado en USB tipo C que se ve en todas las demás tarjetas de la clase Turing hasta ahora se ha ido, una señal de que estamos llegando a un nivel de rendimiento que no conduce a un juego de realidad virtual fluido (incluso en los mejores auriculares de realidad virtual). Los socios de la junta que eligen agregar VirtualLink a sus diseños son libres de hacerlo; EVGA simplemente no lo implementó en este modelo.

Cómo probamos la GeForce GTX 1660 Ti XC Black Gaming de EVGA

Obviamente, GeForce GTX 1660 Ti es más convencional que las otras placas basadas en Turing que hemos revisado. Como tal, nuestra estación de trabajo de gráficos, basada en una placa base MSI Z170 Gaming M7 y una CPU Intel Core i7-7700K a 4.2 GHz, es apropiada. El procesador es …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

700px Tree of life

Archaea vs Bacteria – Diferencia y comparación

post 1 5226

5 alternativas a un Rolex Datejust