in

Revisión de Nvidia GeForce GTX 1660: el ataque de Turing continúa – Tom’s Hardware

NmxZc7aMRH3G95zpRVp8C4 1200 80

Revisión de Nvidia GeForce GTX 1660

Era solo cuestión de tiempo antes de que Nvidia tomara el impecable procesador de gráficos TU116 en su GeForce GTX 1660 Ti y lo dividiera un poco para crear un derivado de menor costo. La nueva GeForce GTX 1660 es, como era de esperar, muy similar al modelo de gama alta en el sentido de que carece de los núcleos RT y Tensor característicos de la arquitectura de Turing. En cambio, apunta a los recursos on-die para acelerar los juegos rasterizados de hoy.

Nvidia ni siquiera recorta mucho del grupo de recursos de TU116 en la creación de GeForce GTX 1660: se eliminan un par de multiprocesadores de transmisión, llevándose 128 núcleos CUDA y ocho unidades de textura con ellos. Pero, por lo demás, la GPU es bastante completa. La mayor pérdida de esta tarjeta es la falta de memoria GDDR6. Al intercambiar GDDR5 de 8 Gb / s, el ancho de banda cae de los 288 GB / s del 1660 Ti a solo 192 GB / s.

Naturalmente, la GeForce GTX 1660 está dirigida principalmente a juegos FHD, donde 6 GB de memoria más lenta no afectarán el rendimiento tanto como lo harían con resoluciones más altas. Sin embargo, ¿puede la placa de $ 220 / £ 200 mantener velocidades de cuadro lo suficientemente rápidas como para evitar la Radeon RX 590 de AMD con más GDDR5 en un bus más ancho?

Resumen de TU116: Turing sin los núcleos RT y Tensor

La GPU en el corazón de GeForce GTX 1660 se llama específicamente TU116-300-A1. Es un pariente cercano del TU116-400-A1 de la GeForce GTX 1660 Ti, recortado de 24 multiprocesadores de transmisión a 22. Obviamente todavía estamos lidiando con un procesador desprovisto de los núcleos RT y Tensor de Nvidia, que miden 284 mm² y están compuestos de 6.6 mil millones de transistores fabricados utilizando el proceso FinFET de 12 nm de TSMC.

A pesar de sus transistores más pequeños, TU116 es un 42 por ciento más grande que el procesador GP106 que lo precedió. Parte de ese crecimiento es atribuible a los sombreadores más sofisticados de la arquitectura de Turing. Al igual que las tarjetas de la serie GeForce RTX 20 de gama alta, GeForce GTX 1660 admite la ejecución simultánea de instrucciones aritméticas FP32, que constituyen la mayoría de las cargas de trabajo de sombreado, y operaciones INT32 (para direccionar / recuperar datos, min / max de punto flotante, comparar, etc. ). Cuando escuche que los núcleos de Turing logran un mejor rendimiento que Pascal a una frecuencia de reloj determinada, esta capacidad explica en gran medida por qué.

Los multiprocesadores de transmisión de Turing están compuestos por menos núcleos CUDA que los de Pascal, pero el diseño lo compensa en parte al distribuir más SM en cada GPU. La arquitectura más nueva asigna un programador a cada conjunto de 16 núcleos CUDA (2x Pascal), junto con una unidad de envío por cada 16 núcleos CUDA (igual que Pascal). Cuatro de esos grupos de 16 núcleos comprenden el SM, junto con 96 KB de caché que se pueden configurar como memoria compartida de 64 KB L1 / 32 KB o viceversa, y cuatro unidades de textura. Debido a que Turing duplica los programadores, solo necesita emitir una instrucción a los núcleos CUDA cada dos ciclos de reloj para mantenerlos llenos. En el medio, es gratis emitir una instrucción diferente a cualquier otra unidad, incluidos los núcleos INT32.

En TU116, Nvidia reemplaza los núcleos Tensor de Turing con 128 núcleos FP16 dedicados por SM, que permiten que GeForce GTX 1660 procese operaciones de precisión media al doble de la velocidad de FP32. Las otras GPU basadas en Turing también cuentan con FP16 de doble velocidad a través de sus núcleos Tensor, por lo que la configuración de TU116 sirve para mantener ese estándar a través del hardware instalado específicamente para esta GPU. La siguiente tabla es una versión actualizada de la publicada en nuestra revisión de GeForce GTX 1660 Ti, que ilustra la mejora masiva de TU116 al rendimiento de media precisión en comparación con GeForce GTX 1060 y su chip GP106 basado en Pascal.

Imagen 1 de 2

1632121402 893 missing image.svg

Imagen 2 de 2

1632121402 893 missing image.svg

Cuando ejecutamos el módulo de análisis científico de Sandra, que prueba las multiplicaciones de la matriz general, vemos cuánto más rendimiento FP16 logran los núcleos Tensor de TU106 en comparación con TU116. GeForce GTX 1060, que solo admitía FP16 simbólicamente, apenas se registra en la tabla.

Además de los sombreadores y la memoria caché unificada de la arquitectura de Turing, TU116 también admite un par de algoritmos denominados Sombreado adaptable al contenido y Sombreado adaptable al movimiento, que en conjunto se denominan Sombreado de velocidad variable. Cubrimos esta tecnología en la Arquitectura Turing explorada de Nvidia: Dentro de la GeForce RTX 2080. Esa historia también presentó las capacidades de codificación y decodificación de video acelerado de Turing, que también se trasladan a GeForce GTX 1660.

Poniendolo todo junto…

Nvidia empaqueta 24 SM en TU116, dividiéndolos entre tres clústeres de procesamiento de gráficos. Con 64 núcleos FP32 por SM, son 1536 núcleos CUDA y 96 unidades de textura en toda la GPU. Al perder dos SM, GeForce GTX 1660 termina con 1,408 núcleos CUDA activos y 88 unidades de textura utilizables.

Los socios de la junta, sin duda, apuntarán a un rango de frecuencias para diferenciar sus tarjetas. Sin embargo, la frecuencia de reloj base oficial es de 1,530 MHz con una especificación GPU Boost de 1,785 MHz.. Ambos números son ligeramente más altos que los relojes de GeForce GTX 1660 Ti, aunque no pueden compensar por completo los SM que faltan.

Nuestra muestra Gigabyte GeForce GTX 1660 OC 6G se mantuvo estable en 1.935 MHz a través de tres ejecuciones de Última luz del metro, operando unos 90 MHz más rápido que el 1660 Ti que revisamos hace unas semanas. En papel, entonces, GeForce GTX 1660 ofrece hasta 5 TFLOPS de rendimiento FP32 y 10 TFLOPS de rendimiento FP16.

Seis controladores de memoria de 32 bits dan a TU116 un bus agregado de 192 bits, que está poblado por módulos GDDR5 de 8 Gb / s que empujan hasta 192 GB / s. Eso es comparable a GeForce GTX 1060 6GB, y una reducción del 33% en comparación con GeForce GTX 1660 Ti. Combinado con la pérdida de dos SM, pasar de la memoria GDDR6 a la GDDR5 representa el menor rendimiento de la GeForce GTX 1660 en comparación con la 1660 Ti.

Cada controlador de memoria está asociado con ocho ROP y un segmento de 256 KB de caché L2. En total, TU116 expone 48 ROP y 1,5 MB de L2. El recuento de ROP de GeForce GTX 1660 se compara favorablemente con RTX 2060, que también utiliza 48 salidas de renderizado. Pero los segmentos de caché L2 de TU116 son la mitad de grandes en comparación con TU106.

Dadas las similitudes con GeForce GTX 1660 Ti, no sorprende que GeForce GTX 1660 tenga los mismos 120W. Desafortunadamente, ninguna de las tarjetas gráficas incluye soporte para múltiples GPU. Nvidia continúa impulsando la narrativa de que SLI está destinado a impulsar un mayor rendimiento absoluto, en lugar de brindar a los jugadores una forma de combinar configuraciones de una sola GPU.

Gigabyte GeForce GTX 1660 OC 6G GeForce GTX 1660 Ti GeForce RTX 2060 FE GeForce GTX 1060 FE GeForce GTX 1070 FE
Arquitectura (GPU) Turing (TU116) Turing (TU116) Turing (TU106) Pascal (GP106) Pascal (GP104)
Núcleos CUDA 1408 1536 1920 1280 1920
Computación pico FP32 5 TFLOPS 5.4 TFLOPS 6.45 TLFOPS 4.4 TFLOPS 6.5 TFLOPS
Núcleos de tensor N / A N / A 240 N / A N / A
Núcleos RT N / A N / A 30 N / A N / A
Unidades de textura 88 96 120 80 120
Frecuencia de reloj base 1530 MHz 1500 MHz 1365 MHz 1506 MHz 1506 MHz
Tasa de aumento de GPU 1785 MHz 1770 MHz 1680 MHz 1708 MHz 1683 MHz
Capacidad de memoria GDDR5 de 6 GB GDDR6 de 6 GB GDDR6 de 6 GB GDDR5 de 6 GB GDDR5 de 8 GB
Bus de memoria 192 bits 192 bits 192 bits 192 bits 256 bits
ancho de banda de memoria 192 GB / s 288 GB / s 336 GB / s 192 GB / s 256 GB / s
ROP 48 48 48 48 64
Caché L2 1,5 MB 1,5 MB 3 MB 1,5 MB 2 MB
TDP 120W 120W 160W 120W 150W
Recuento de transistores 6,6 mil millones 6,6 mil millones 10,8 mil millones 4.4 mil millones 7.2 mil millones
Tamaño de la matriz 284 mm² 284 mm² 445 mm² 200 mm² 314 mm²
Soporte SLI No No No No Sí (MIO)

MÁS: Mejores tarjetas gráficas

MÁS: Tabla de jerarquía de rendimiento de GPU de escritorio

MÁS: Cómo comprar la GPU adecuada

MÁS: Todo el contenido de gráficos

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

edit

Cable vs DSL: diferencia y comparación

Michael Kors Bradshaw MK6487

Michael Kors Bradshaw MK6487 | WatchShopping.com