Bloque de rasterización qué. Sabia elección de tarjeta de video

La tasa de llenado muestra qué tan rápido el chip de video es capaz de dibujar píxeles. Hay dos tipos de tasa de relleno: tasa de relleno de píxeles y tasa de relleno de textura. La tasa de relleno de píxeles muestra la velocidad de dibujar píxeles en la pantalla y depende de la frecuencia operativa y la cantidad de unidades ROP (unidades de operación de rasterización y combinación), y la tasa de relleno de textura es la velocidad de muestreo de datos de textura, que depende de la frecuencia operativa. y el número de unidades de textura.

Por ejemplo, la tasa de relleno de píxeles de la GeForce GTX 275 es 633 (frecuencia del chip) * 28 (número de unidades ROP) = 17724 megapíxeles por segundo, y la tasa de relleno de textura es 633 * 80 (número de unidades de texturizado) = 50640 megaxeles/s . Cuanto mayor sea el primer número, más rápido la tarjeta de video podrá dibujar los píxeles terminados, y cuanto mayor sea el segundo, más rápido se muestrearán los datos de textura. Ambos parámetros son importantes para los juegos modernos, pero deben estar equilibrados. Esta es la razón por la que la cantidad de unidades ROP en los chips modernos suele ser menor que la cantidad de unidades de textura.

Número de bloques de sombreado (píxel, vértice).

El sombreador de vértices es responsable de construir los vértices de un objeto. Determinan las capacidades de las tarjetas modernas para procesar objetos gráficos primitivos y, en general, el rendimiento de la propia tarjeta. Un sombreador de píxeles es más relevante que un sombreador de vértices, por lo que su número suele ser mayor. La división en píxeles y vértices ha perdido recientemente (con el lanzamiento de Direct 10) su relevancia. Todos ellos son reemplazados por bloques de sombreadores unificados únicos, según la situación específica. Utilizan sombreadores de píxeles y vértices, así como geométricos, que aparecieron en Direct 10.

Número de unidades de texturizado TMU

La cantidad de unidades de texturizado TMU que determinan el rendimiento de la textura, o la velocidad a la que se muestrean y asignan las texturas. Esto es especialmente relevante para el filtrado anisotrópico. Los bloques TMU son más importantes en los juegos más antiguos. Ahora prácticamente han perdido su relevancia, porque... El ancho de banda del bus de memoria en los sistemas modernos no es suficiente para que las tarjetas de alto rendimiento funcionen normalmente. La mayoría de ellos están equipados con su propia memoria, que es necesaria para almacenar los datos necesarios, como texturas, vértices, etc.

Unidades de operación de rasterización (ROP)

Las unidades de rasterización realizan las operaciones de escribir píxeles calculados por la tarjeta de video en buffers y las operaciones de mezclarlos (blending). Como señalamos anteriormente, el rendimiento de los bloques ROP afecta la tasa de llenado y esta es una de las principales características de las tarjetas de video de todos los tiempos. Y aunque su importancia también ha disminuido un poco recientemente, todavía hay casos en los que el rendimiento de la aplicación depende de la velocidad y la cantidad de bloques ROP. En la mayoría de los casos, esto se debe al uso activo de filtros de posprocesamiento y suavizado habilitados en configuraciones altas del juego.

Notemos una vez más que los chips de video modernos no pueden evaluarse únicamente por el número de bloques diferentes y su frecuencia. Cada serie de GPU utiliza una nueva arquitectura, en la que las unidades de ejecución son muy diferentes de las antiguas y la proporción entre el número de unidades diferentes puede diferir. Por lo tanto, las unidades AMD ROP en algunas soluciones pueden realizar más trabajo por ciclo de reloj que las unidades en las soluciones NVIDIA, y viceversa. Lo mismo se aplica a las capacidades de las unidades de textura TMU: son diferentes en diferentes generaciones de GPU de diferentes fabricantes, y esto debe tenerse en cuenta al comparar.

Bloques geométricos

Hasta hace poco, el número de unidades de procesamiento de geometría no era particularmente importante. Un bloque en la GPU era suficiente para la mayoría de las tareas, ya que la geometría en los juegos era bastante simple y el objetivo principal del rendimiento eran los cálculos matemáticos. La importancia del procesamiento de geometría paralelo y el número de bloques correspondientes aumentó dramáticamente con la llegada del soporte de teselación de geometría en DirectX 11. NVIDIA fue la primera en paralelizar el procesamiento de datos geométricos cuando aparecieron varios bloques correspondientes en sus chips de la familia GF1xx. Luego, AMD lanzó una solución similar (solo en las soluciones superiores de la línea Radeon HD 6700 basada en chips Cayman).

Tamaño de la memoria de vídeo

Los chips de vídeo utilizan su propia memoria para almacenar los datos necesarios: texturas, vértices, datos del búfer, etc. Parecería que cuanto más, mejor. Pero no es tan simple: estimar la potencia de una tarjeta de video basándose en la cantidad de memoria de video es el error más común. Los usuarios inexpertos suelen sobrestimar el valor de la memoria de vídeo y aún así la utilizan para comparar. diferentes modelos tarjetas de video Esto es comprensible: este parámetro es uno de los primeros que se indica en las listas de características de los sistemas terminados y está escrito en letra grande en las cajas de las tarjetas de video. Por lo tanto, a un comprador inexperto le parece que, dado que hay el doble de memoria, la velocidad de dicha solución debería ser el doble. La realidad difiere de este mito en que la memoria viene en diferentes tipos y características, y el crecimiento de la productividad crece sólo hasta un cierto volumen, y después de alcanzarlo simplemente se detiene.

Los chips de memoria tienen más parámetros importantes, como el ancho del bus de memoria y su frecuencia de funcionamiento.

Ancho del bus de memoria.

El ancho del bus de memoria es la característica más importante que afecta el ancho de banda de la memoria (MBB). Un ancho mayor permite transferir más información desde la memoria de video a la GPU y viceversa por unidad de tiempo, lo que tiene un efecto positivo en el rendimiento en la mayoría de los casos. En teoría, un bus de 256 bits puede transferir el doble de datos por ciclo de reloj que un bus de 128 bits. En la práctica, la diferencia en la velocidad de renderizado, aunque no llega al doble, en muchos casos está muy cerca de esto, con énfasis en el ancho de banda de la memoria de video.

Las tarjetas de video para juegos modernas utilizan diferentes anchos de bus: de 64 a 384 bits (anteriormente había chips con un bus de 512 bits), dependiendo del rango de precios y el tiempo de lanzamiento de un modelo de GPU en particular. Para las tarjetas de video de gama baja más baratas, se usan con mayor frecuencia 64 y con menos frecuencia 128 bits, para el nivel medio de 128 a 256 bits, y las tarjetas de video del rango de precios superior usan buses de 256 a 384 bits de ancho. El ancho del bus ya no puede crecer simplemente debido a limitaciones físicas: el tamaño del chip de la GPU es insuficiente para acomodar más de un bus de 512 bits, y esto es demasiado caro. Por lo tanto, el ancho de banda de la memoria ahora se incrementa mediante el uso de nuevos tipos de memoria (ver más abajo).

Frecuencia de la memoria de vídeo

Otro parámetro que afecta el ancho de banda de la memoria es su frecuencia de reloj. Y el aumento del ancho de banda a menudo afecta directamente el rendimiento de la tarjeta de video en aplicaciones 3D. La frecuencia del bus de memoria en las tarjetas de video modernas varía de 533 (1066, teniendo en cuenta la duplicación) a 1375 (5500, teniendo en cuenta la cuadriplicación) MHz, es decir, ¡puede diferir en más de cinco veces! Y dado que el ancho de banda depende tanto de la frecuencia de la memoria como del ancho de su bus, la memoria con un bus de 256 bits operando a una frecuencia de 800 (3200) MHz tendrá un mayor ancho de banda en comparación con la memoria que opera a 1000 (4000) MHz con un 128. -bus de bits.

Tipos de memoria

Las tarjetas de video modernas están equipadas con varios tipos diferentes de memoria. Ya no encontrará memorias SDR antiguas de una sola velocidad en ningún lado, pero los tipos modernos de memoria DDR y GDDR tienen características significativamente diferentes. Varios tipos de DDR y GDDR le permiten transferir dos o cuatro veces más datos a la misma frecuencia de reloj por unidad de tiempo y, por lo tanto, la cifra de frecuencia operativa a menudo se duplica o cuadruplica, multiplicada por 2 o 4. Entonces, si se especifica la frecuencia para la memoria DDR de 1400 MHz, entonces esta memoria opera a una frecuencia física de 700 MHz, pero indican la frecuencia llamada “efectiva”, es decir, aquella a la que debe operar la memoria SDR para proporcionar el mismo ancho de banda. Lo mismo ocurre con GDDR5, pero la frecuencia incluso se cuadriplica.

La principal ventaja de los nuevos tipos de memoria es la capacidad de funcionar a velocidades de reloj más altas y, en consecuencia, un aumento del ancho de banda en comparación con las tecnologías anteriores. Esto se logra a expensas de mayores latencias, que, sin embargo, no son tan importantes para las tarjetas de video.

De ello se deduce que cuanto mayor sea la memoria de la tarjeta de video, mayor será el rendimiento. Los parámetros importantes son la frecuencia de funcionamiento del autobús y su ancho. Un ancho de bus mayor permite transferir más información por unidad de tiempo desde la memoria de video a la GPU y viceversa. Esto asegura un mayor rendimiento de la tarjeta de video en igualdad de condiciones. El ancho del bus es de 64 a 128 bits para una tarjeta de video económica, de 128 a 256 bits para tarjetas de rango medio, para nivel alto– 256-512 bits.


1.2 Descripción del funcionamiento y diagrama de bloques del dispositivo

Al construir una imagen, después de procesar la señal de video por parte del procesador central, los datos se envían al bus de datos de la tarjeta de video. A continuación, los datos se envían a la unidad de ejecución de comandos en paralelo, y de ésta a la GPU (procesador gráfico), en la que se realizan las siguientes acciones:

· Transformación: los objetos simples suelen necesitar ser cambiados o transformados de cierta manera para crear un objeto más natural o imitar su movimiento en el espacio. Para ello, se recalculan las coordenadas de los vértices de las caras del objeto (vértice) mediante operaciones de álgebra matricial y transformaciones geométricas. En las tarjetas de vídeo se utiliza intensamente para este fin. coprocesador geométrico.

· Cálculo de iluminación y sombreado: para que un objeto sea visible en la pantalla, es necesario calcular la iluminación y el sombreado de cada rectángulo o triángulo elemental. Además, es necesario simular la distribución real de la iluminación, es decir, es necesario ocultar los cambios de iluminación entre rectángulos o triángulos; esto lo hace la Unidad de Rasterización.

· Mapeo de texturas: para crear una imagen realista, se aplica una textura a cada superficie elemental que imita la superficie real. Las texturas se almacenan en la memoria como imágenes rasterizadas.

· Corrección de defectos: las líneas simuladas y los límites de los objetos, si no son verticales u horizontales, se ven angulares en la pantalla, por lo que se lleva a cabo una corrección de la imagen, llamada antialiasing ( suavizado);

Después del procesamiento de GPU, los objetos son procesados ​​por el bloque "Z-buffer":

· Proyección: un objeto tridimensional se convierte en uno bidimensional, pero se recuerdan las distancias de los vértices de las caras a la superficie de la pantalla (coordenada Z, búfer Z) sobre la que se proyecta el objeto;

· Eliminación de superficies ocultas: elimina todas las superficies invisibles de una proyección 2D de un objeto 3D.

Después de calcular todos los puntos del cuadro, la información sobre cada píxel se mueve a la memoria de video.

En la paleta y el bloque de control de superposición de imágenes, los colores faltantes se interpolan; si se usó una cantidad diferente de colores al modelar objetos que en el modo de tarjeta de video actual, entonces es necesario calcular los colores faltantes o eliminar los redundantes.

Si la tarjeta de video está conectada a un monitor basado en un tubo de rayos catódicos, los datos van a un DAC (convertidor de digital a analógico) en el que las señales digitales se convierten en señales RGB analógicas comprensibles para el monitor.

Si la tarjeta de video está conectada a un monitor digital, la información de la imagen se convierte al formato de pantalla del monitor.

Componentes básicos de una tarjeta de video:

  • salidas;
  • interfaces;
  • sistema de refrigeración;
  • GPU;
  • memoria de video.

Tecnologías gráficas:

  • diccionario;
  • Arquitectura de GPU: características
    unidades de vértice/píxel, sombreadores, tasa de relleno, unidades de textura/ráster, canalizaciones;
  • Arquitectura GPU: tecnología
    proceso técnico, frecuencia de GPU, memoria de video local (volumen, bus, tipo, frecuencia), soluciones con múltiples tarjetas de video;
  • funciones visuales
    DirectX, alto rango dinámico (HDR), anti-aliasing de pantalla completa, filtrado de texturas, texturas de alta resolución.

Glosario de términos gráficos básicos.

Frecuencia de actualización

Al igual que en una sala de cine o televisión, su computadora simula el movimiento en el monitor mostrando una secuencia de fotogramas. La frecuencia de actualización del monitor indica cuántas veces por segundo se actualizará la imagen en la pantalla. Por ejemplo, una frecuencia de 75 Hz corresponde a 75 actualizaciones por segundo.

Si la computadora procesa fotogramas más rápido de lo que puede generar el monitor, pueden surgir problemas en los juegos. Por ejemplo, si la computadora genera 100 cuadros por segundo y la frecuencia de actualización del monitor es de 75 Hz, debido a las superposiciones, el monitor solo puede mostrar parte de la imagen durante su período de actualización. Como resultado, aparecen artefactos visuales.

Como solución, puede habilitar V-Sync (sincronización vertical). Limita la cantidad de cuadros que la computadora puede generar a la frecuencia de actualización del monitor, evitando artefactos. Si habilitas V-Sync, la cantidad de cuadros calculados en el juego nunca excederá la frecuencia de actualización. Es decir, a 75 Hz la computadora no generará más de 75 fotogramas por segundo.

Píxel

La palabra "Pixel" significa " Foto tura el ement" - elemento de imagen. Es un pequeño punto en la pantalla que puede brillar en un color determinado (en la mayoría de los casos, el tono se muestra mediante una combinación de tres colores básicos: rojo, verde y azul). Si la resolución de la pantalla es 1024x768, entonces podrá ver una matriz de 1024 píxeles de ancho y 768 píxeles de alto. Todos los píxeles juntos forman la imagen. La imagen en la pantalla se actualiza de 60 a 120 veces por segundo, según el tipo de visualización y la salida de datos de la tarjeta de video. Los monitores CRT actualizan la pantalla línea por línea, mientras que los monitores LCD de panel plano pueden actualizar cada píxel individualmente.

Vértice

Todos los objetos en una escena 3D están formados por vértices. Un vértice es un punto en el espacio tridimensional con coordenadas X, Y y Z. Se pueden agrupar varios vértices en un polígono: la mayoría de las veces es un triángulo, pero son posibles formas más complejas. Luego se aplica una textura al polígono, lo que hace que el objeto parezca realista. El cubo 3D que se muestra en la ilustración anterior consta de ocho vértices. Los objetos más complejos tienen superficies curvas que en realidad están formadas por una gran cantidad de vértices.

Textura

Una textura es simplemente una imagen 2D de un tamaño arbitrario que se asigna a un objeto 3D para simular su superficie. Por ejemplo, nuestro cubo 3D consta de ocho vértices. Antes de aplicar la textura, parece una simple caja. Pero cuando aplicamos la textura, la caja se colorea.

sombreador

Los programas de sombreado de píxeles permiten que la tarjeta de video produzca efectos impresionantes, como este agua en Pergaminos antiguos: El olvido.

Hoy en día existen dos tipos de sombreadores: vértice y píxel. Los programas de sombreado de vértices pueden modificar o transformar objetos 3D. Los programas de sombreado de píxeles le permiten cambiar los colores de los píxeles en función de algunos datos. Imagine una fuente de luz en una escena 3D que hace que los objetos iluminados brillen más y, al mismo tiempo, provoca que se proyecten sombras sobre otros objetos. Todo esto se consigue cambiando la información de color de los píxeles.

Los sombreadores de píxeles se utilizan para crear efectos complejos en tus juegos favoritos. Por ejemplo, el código de sombreado puede hacer que los píxeles que rodean una espada 3D brillen más. Otro sombreador puede procesar todos los vértices de un objeto 3D complejo y simular una explosión. Los desarrolladores de juegos recurren cada vez más a sofisticados programas de sombreado para crear gráficos realistas. Casi todos los juegos modernos con gráficos ricos utilizan sombreadores.

Con el lanzamiento de la próxima interfaz de programación de aplicaciones (API), Microsoft DirectX 10, se lanzará un tercer tipo de sombreador, llamado sombreadores de geometría. Con su ayuda será posible romper objetos, modificarlos e incluso destruirlos, según el resultado deseado. El tercer tipo de sombreadores se puede programar exactamente de la misma forma que los dos primeros, pero su función será diferente.

Tasa de relleno

Muy a menudo, en la caja de la tarjeta de video se puede encontrar el valor de la tasa de llenado. Básicamente, la tasa de llenado indica qué tan rápido la GPU puede generar píxeles. Las tarjetas de video más antiguas tenían una tasa de llenado triangular. Pero hoy en día existen dos tipos de tasas de relleno: tasa de relleno de píxeles y tasa de relleno de texturas. Como ya se mencionó, la tasa de llenado de píxeles corresponde a la tasa de salida de píxeles. Se calcula como el número de operaciones ráster (ROP) multiplicado por la frecuencia del reloj.

La tasa de relleno de textura se calcula de forma diferente entre ATi y nVidia. Nvidia cree que la velocidad se obtiene multiplicando el número de canales de píxeles por la frecuencia del reloj. Y ATi multiplica el número de unidades de textura por la velocidad del reloj. En principio, ambos métodos son correctos, ya que nVidia utiliza una unidad de textura por unidad de sombreado de píxeles (es decir, una por canalización de píxeles).

Con estas definiciones en mente, avancemos y analicemos las funciones más importantes de la GPU, qué hacen y por qué son tan importantes.

Arquitectura de GPU: características

El realismo de los gráficos 3D depende en gran medida del rendimiento de la tarjeta de vídeo. Cuantos más bloques de sombreado de píxeles contenga el procesador y cuanto mayor sea la frecuencia, más efectos se podrán aplicar a la escena 3D para mejorar su percepción visual.

La GPU contiene muchos bloques funcionales diferentes. Por la cantidad de algunos componentes, puedes estimar qué tan potente es la GPU. Antes de continuar, repasemos los bloques funcionales más importantes.

Procesadores Vertex (unidades de sombreado de vértices)

Al igual que las unidades de sombreado de píxeles, los procesadores de vértices ejecutan código de sombreado que toca los vértices. Debido a que un mayor presupuesto de vértices permite crear objetos 3D más complejos, el rendimiento de los procesadores de vértices es muy importante en escenas 3D con una gran cantidad de objetos o complejos. Sin embargo, las unidades de sombreado de vértices todavía no tienen un impacto tan obvio en el rendimiento como los procesadores de píxeles.

Procesadores de píxeles (unidades de sombreado de píxeles)

Un procesador de píxeles es un componente de un chip gráfico dedicado a procesar programas de sombreado de píxeles. Estos procesadores realizan cálculos que conciernen únicamente a los píxeles. Debido a que los píxeles contienen información de color, los sombreadores de píxeles le permiten lograr efectos gráficos impresionantes. Por ejemplo, la mayoría de los efectos de agua que ves en los juegos se crean utilizando sombreadores de píxeles. Normalmente, la cantidad de procesadores de píxeles se utiliza para comparar el rendimiento de los píxeles de las tarjetas de video. Si una tarjeta tiene ocho unidades de sombreado de píxeles y otra tiene 16 unidades, entonces es lógico suponer que una tarjeta de vídeo con 16 unidades será más rápida a la hora de procesar programas complejos de sombreado de píxeles. También se debe tener en cuenta la velocidad del reloj, pero hoy en día duplicar el número de procesadores de píxeles es más eficiente energéticamente que duplicar la frecuencia del chip gráfico.

Sombreadores unificados

Los sombreadores unificados aún no han llegado al mundo de las PC, pero el próximo estándar DirectX 10 se basa en una arquitectura similar. Es decir, la estructura del código de los programas de vértices, geometría y píxeles será la misma, aunque los sombreadores realizarán trabajos diferentes. La nueva especificación se puede ver en la Xbox 360, donde la GPU fue diseñada especialmente por ATi para Microsoft. Será muy interesante ver qué potencial aporta el nuevo DirectX 10.

Unidades de mapeo de textura (TMU)

Las texturas deben seleccionarse y filtrarse. Este trabajo lo realizan unidades de mapeo de texturas, que funcionan en conjunto con unidades de sombreado de píxeles y vértices. El trabajo de la TMU es aplicar operaciones de textura a los píxeles. La cantidad de unidades de textura en una GPU se usa a menudo para comparar el rendimiento de textura de las tarjetas de video. Es razonable suponer que una tarjeta gráfica con más TMU proporcionará un mejor rendimiento de textura.

Unidades de operador ráster (ROP)

Los procesadores ráster son responsables de escribir datos de píxeles en la memoria. La velocidad a la que se realiza esta operación es la tasa de llenado. En los primeros días de los aceleradores 3D, la ROP y la tasa de llenado eran características muy importantes de las tarjetas de video. Hoy en día, el trabajo de ROP sigue siendo importante, pero el rendimiento de la tarjeta de vídeo ya no está limitado por estos bloques como antes. Por lo tanto, el rendimiento (y la cantidad) de ROP rara vez se utiliza para evaluar la velocidad de una tarjeta de video.

Transportadores

Los pipelines se utilizan para describir la arquitectura de las tarjetas de video y dar una idea muy clara del rendimiento de la GPU.

Transportador no puede considerarse un término técnico estricto. La GPU utiliza diferentes canales que realizan diferentes funciones. Históricamente, una canalización significaba un procesador de píxeles que estaba conectado a su unidad de mapeo de texturas (TMU). Por ejemplo, la tarjeta de video Radeon 9700 utiliza procesadores de ocho píxeles, cada uno de los cuales está conectado a su propia TMU, por lo que se considera que la tarjeta tiene ocho canales.

Pero los procesadores modernos son muy difíciles de describir por la cantidad de tuberías. En comparación con diseños anteriores, los nuevos procesadores utilizan una estructura modular y fragmentada. ATi puede considerarse un innovador en esta área, que, con la línea de tarjetas de video X1000, cambió a estructura modular, lo que permitió lograr mejoras de rendimiento a través de la optimización interna. Algunos bloques de CPU se utilizan más que otros y, para mejorar el rendimiento de la GPU, ATi ha intentado encontrar un equilibrio entre la cantidad de bloques necesarios y el área del troquel (que no se puede aumentar mucho). En esta arquitectura, el término "pixel pipeline" ya ha perdido su significado, ya que los procesadores de píxeles ya no están conectados a sus propias TMU. Por ejemplo, la GPU ATi Radeon X1600 tiene unidades de sombreado de 12 píxeles y sólo cuatro unidades de mapeo de textura TMU. Por tanto, no se puede decir que la arquitectura de este procesador tenga pipelines de 12 píxeles, como tampoco se puede decir que solo haya cuatro. Sin embargo, por tradición, todavía se mencionan las canalizaciones de píxeles.

Teniendo en cuenta las suposiciones anteriores, la cantidad de canales de píxeles en una GPU se usa a menudo para comparar tarjetas de video (con la excepción de la línea ATi X1x00). Por ejemplo, si toma tarjetas de video con 24 y 16 canales, entonces es bastante razonable suponer que la tarjeta con 24 canales será más rápida.

Arquitectura de GPU: tecnología

Proceso técnico

Este término se refiere al tamaño de un elemento (transistor) del chip y a la precisión del proceso de fabricación. Las mejoras en los procesos técnicos permiten obtener elementos de menor tamaño. Por ejemplo, el proceso de 0,18 micrones produce características más grandes que el proceso de 0,13 micrones, por lo que no es tan eficiente. Los transistores más pequeños funcionan a un voltaje más bajo. A su vez, una disminución del voltaje conduce a una disminución de la resistencia térmica, lo que resulta en una disminución de la cantidad de calor generado. Las mejoras en el proceso técnico permiten reducir la distancia entre los bloques funcionales del chip y la transferencia de datos lleva menos tiempo. Distancias más cortas, voltajes más bajos y otras mejoras permiten alcanzar velocidades de reloj más altas.

Lo que complica un poco la comprensión es que hoy en día se utilizan tanto micrómetros (μm) como nanómetros (nm) para designar un proceso técnico. De hecho, todo es muy sencillo: 1 nanómetro equivale a 0,001 micrómetros, por lo que los procesos de 0,09 μm y 90 nm son lo mismo. Como se señaló anteriormente, una tecnología de proceso más pequeña permite velocidades de reloj más altas. Por ejemplo, si comparamos tarjetas de video con chips de 0,18 micrones y 0,09 micrones (90 nm), entonces es bastante razonable esperar una frecuencia más alta de una tarjeta de 90 nm.

Velocidad de reloj de la GPU

La velocidad de reloj de la GPU se mide en megahercios (MHz), que son millones de ciclos de reloj por segundo.

La velocidad del reloj afecta directamente el rendimiento de la GPU. Cuanto más alto sea, más trabajo se podrá realizar en un segundo. Para el primer ejemplo, tomemos las tarjetas de video nVidia GeForce 6600 y 6600 GT: la GPU 6600 GT funciona a 500 MHz, mientras que la tarjeta 6600 normal funciona a 400 MHz. Dado que los procesadores son técnicamente idénticos, el aumento del 20% en la velocidad del reloj del 6600 GT da como resultado un mayor rendimiento.

Pero la velocidad del reloj no lo es todo. Tenga en cuenta que el rendimiento está muy influenciado por la arquitectura. Para el segundo ejemplo, tomemos las tarjetas de video GeForce 6600 GT y GeForce 6800 GT. La GPU 6600 GT funciona a 500 MHz, pero la 6800 GT funciona a sólo 350 MHz. Ahora tomemos en cuenta que el 6800 GT usa canales de 16 píxeles, mientras que el 6600 GT usa solo ocho. Por lo tanto, un 6800 GT con 16 canales a 350 MHz dará aproximadamente el mismo rendimiento que un procesador con ocho canales y el doble de velocidad de reloj (700 MHz). Dicho esto, la velocidad del reloj se puede utilizar fácilmente para comparar el rendimiento.

Memoria de vídeo local

La memoria de la tarjeta de video afecta en gran medida el rendimiento. Pero diferentes parámetros de memoria tienen diferentes efectos.

Tamaño de la memoria de vídeo

La cantidad de memoria de video probablemente pueda considerarse el parámetro más sobreestimado de una tarjeta de video. Los consumidores inexpertos suelen utilizar la capacidad de la memoria de vídeo para comparar diferentes tarjetas entre sí, pero en realidad, la capacidad tiene poco efecto sobre el rendimiento en comparación con parámetros como la frecuencia del bus de memoria y la interfaz (ancho del bus).

En la mayoría de los casos, una tarjeta con 128 MB de memoria de vídeo funcionará casi igual que una tarjeta con 256 MB. Por supuesto, hay situaciones en las que más memoria mejorará el rendimiento, pero tenga en cuenta que más memoria no conducirá automáticamente a velocidades de juego más rápidas.

Donde el volumen puede resultar útil es en juegos con texturas de alta resolución. Los desarrolladores de juegos proporcionan varios conjuntos de texturas para el juego. Y cuanta más memoria haya en la tarjeta de video, mayor resolución podrán tener las texturas cargadas. Las texturas de alta resolución brindan mayor claridad y detalle en el juego. Por lo tanto, es bastante razonable adquirir una tarjeta con una gran cantidad de memoria, si todos los demás criterios coinciden. Permítanos recordarle una vez más que el ancho del bus de memoria y su frecuencia tienen un impacto mucho mayor en el rendimiento que la cantidad de memoria física en la tarjeta.

Ancho del bus de memoria

El ancho del bus de memoria es uno de los aspectos más importantes del rendimiento de la memoria. Los buses modernos tienen un ancho de 64 a 256 bits y, en algunos casos, incluso 512 bits. Cuanto más amplio sea el bus de memoria, más información podrá transferir por ciclo de reloj. Y esto afecta directamente a la productividad. Por ejemplo, si toma dos buses con frecuencias iguales, entonces, en teoría, un bus de 128 bits transferirá el doble de datos por ciclo de reloj que un bus de 64 bits. Y el bus de 256 bits es el doble de grande.

Un mayor ancho de banda del bus (expresado en bits o bytes por segundo, 1 byte = 8 bits) proporciona un mayor rendimiento de la memoria. Por eso el bus de memoria es mucho más importante que su tamaño. ¡A frecuencias iguales, el bus de memoria de 64 bits funciona a una velocidad de solo el 25% del de 256 bits!

Tomemos el siguiente ejemplo. Una tarjeta de video con 128 MB de memoria de video, pero con un bus de 256 bits, ofrece un rendimiento de memoria mucho mayor que un modelo de 512 MB con un bus de 64 bits. Es importante señalar que para algunas tarjetas de la línea ATi X1x00, los fabricantes indican las especificaciones del bus de memoria interno, pero a nosotros nos interesan los parámetros del bus externo. Por ejemplo, el X1600 tiene un bus de anillo interno de 256 bits de ancho, pero uno externo de sólo 128 bits de ancho. Y en realidad, el bus de memoria funciona con un rendimiento de 128 bits.

Tipos de memoria

La memoria se puede dividir en dos categorías principales: SDR (transferencia de datos única) y DDR (transferencia de datos doble), en las que los datos se transfieren dos veces más rápido por ciclo de reloj. Hoy en día, la tecnología SDR de transmisión única está obsoleta. Dado que la memoria DDR transfiere datos dos veces más rápido que la SDR, es importante recordar que las tarjetas de video con memoria DDR a menudo indican el doble de frecuencia, no la frecuencia física. Por ejemplo, si la memoria DDR se especifica a 1000 MHz, entonces esta es la frecuencia efectiva a la que debe funcionar la memoria SDR normal para ofrecer el mismo rendimiento. Pero, de hecho, la frecuencia física es de 500 MHz.

Por esta razón, muchos se sorprenden cuando se indica la frecuencia de 1200 MHz DDR para la memoria de su tarjeta de video, y las utilidades informan 600 MHz. Así que tendrás que acostumbrarte. Las memorias DDR2 y GDDR3/GDDR4 funcionan según el mismo principio, es decir, con doble transferencia de datos. La diferencia entre las memorias DDR, DDR2, GDDR3 y GDDR4 radica en la tecnología de producción y en algunos detalles. DDR2 puede funcionar a frecuencias más altas que la memoria DDR y DDR3 puede funcionar a frecuencias incluso más altas que DDR2.

Frecuencia del bus de memoria

Al igual que un procesador, la memoria (o más precisamente, el bus de memoria) funciona a velocidades de reloj específicas, medidas en megahercios. Aquí, el aumento de la velocidad del reloj afecta directamente el rendimiento de la memoria. Y la frecuencia del bus de memoria es uno de los parámetros que se utiliza para comparar el rendimiento de las tarjetas de video. Por ejemplo, si todas las demás características (ancho del bus de memoria, etc.) son iguales, entonces es bastante lógico decir que una tarjeta de video con memoria de 700 MHz es más rápida que una con memoria de 500 MHz.

Una vez más, la velocidad del reloj no lo es todo. La memoria de 700 MHz con un bus de 64 bits será más lenta que la memoria de 400 MHz con un bus de 128 bits. El rendimiento de una memoria de 400 MHz en un bus de 128 bits es aproximadamente equivalente al de una memoria de 800 MHz en un bus de 64 bits. También debes recordar que las frecuencias de la GPU y la memoria son parámetros completamente diferentes y, por lo general, difieren.

Interfaz de tarjeta de video

Todos los datos transferidos entre la tarjeta de video y el procesador pasan a través de la interfaz de la tarjeta de video. Hoy en día, se utilizan tres tipos de interfaces para tarjetas de video: PCI, AGP y PCI Express. Se diferencian en el ancho de banda y otras características. Está claro que cuanto mayor sea el rendimiento, mayor será la velocidad de intercambio. Sin embargo, sólo las tarjetas más modernas pueden utilizar un gran ancho de banda, y aun así sólo parcialmente. En algún momento, la velocidad de la interfaz dejó de ser un cuello de botella; hoy es simplemente suficiente.

El bus más lento para el que se produjeron las tarjetas de video es PCI (Peripheral Components Interconnect). Sin entrar en la historia, claro está. PCI realmente degradó el rendimiento de las tarjetas de video, por lo que cambiaron a la interfaz AGP (Accelerated Graphics Port). Pero incluso las especificaciones AGP 1.0 y 2x limitaron el rendimiento. Cuando el estándar aumentó las velocidades a niveles AGP 4x, comenzamos a acercarnos al límite práctico del ancho de banda que pueden manejar las tarjetas de video. La especificación AGP 8x volvió a duplicar el rendimiento en comparación con AGP 4x (2,16 GB/s), pero ya no obtuvimos un aumento notable en el rendimiento gráfico.

El bus más nuevo y rápido es PCI Express. Las nuevas tarjetas gráficas suelen utilizar la interfaz PCI Express x16, que combina 16 carriles PCI Express para un rendimiento total de 4 GB/s (una dirección). Esto es el doble del rendimiento de AGP 8x. El bus PCI Express proporciona el ancho de banda mencionado en ambas direcciones (transferencia de datos hacia y desde la tarjeta de video). Pero la velocidad del estándar AGP 8x ya era suficiente, por lo que todavía no nos hemos encontrado con una situación en la que el cambio a PCI Express haya dado un aumento en el rendimiento en comparación con AGP 8x (si los demás parámetros de hardware son los mismos). Por ejemplo, la versión AGP de la GeForce 6800 Ultra funcionará de manera idéntica a la 6800 Ultra para PCI Express.

Hoy en día lo mejor es comprar una tarjeta con interfaz PCI Express, permanecerá en el mercado durante varios años más. Las tarjetas más potentes ya no se fabrican con la interfaz AGP 8x y las soluciones PCI Express, por regla general, son más fáciles de encontrar que las análogas AGP y son más baratas.

Soluciones en múltiples tarjetas de video

Usar varias tarjetas de video para aumentar el rendimiento de los gráficos no es una idea nueva. En los primeros días de los gráficos 3D, 3dfx ingresó al mercado con dos tarjetas gráficas ejecutándose en paralelo. Pero con la desaparición de 3dfx, la tecnología para el funcionamiento conjunto de varias tarjetas de video de consumo quedó relegada al olvido, aunque ATi produce sistemas similares para simuladores profesionales desde el lanzamiento de la Radeon 9700. Hace un par de años, la tecnología volvió a el mercado: con la llegada de las soluciones nVidia SLI y, un poco más tarde, ATi Crossfire.

El uso de varias tarjetas gráficas juntas proporciona suficiente rendimiento para ejecutar el juego en configuraciones de alta calidad y alta resolución. Pero elegir una solución u otra no es tan sencillo.

Para empezar, las soluciones basadas en múltiples tarjetas de video requieren una gran cantidad de energía, por lo que la fuente de alimentación debe ser lo suficientemente potente. Todo este calor deberá eliminarse de la tarjeta de video, por lo que debe prestar atención a la carcasa de la PC y al enfriamiento para que el sistema no se sobrecaliente.

Además, recuerde que SLI/CrossFire requiere la configuración adecuada. tarjeta madre(ya sea por una tecnología u otra), que suele costar más respecto a los modelos estándar. La configuración nVidia SLI solo funcionará en ciertas placas nForce4, y las tarjetas ATi CrossFire solo funcionarán en placas base con el chipset CrossFire o en ciertos modelos Intel. Para complicar las cosas, algunas configuraciones de CrossFire requieren que una de las tarjetas sea especial: CrossFire Edition. Después del lanzamiento de CrossFire, para algunos modelos de tarjetas de video, ATi permitió la inclusión de tecnología de colaboración a través del bus PCI Express y, con el lanzamiento de nuevas versiones de controladores, aumenta el número de combinaciones posibles. Pero aún así, el hardware CrossFire con la tarjeta CrossFire Edition correspondiente proporciona un mayor rendimiento. Pero las tarjetas CrossFire Edition también son más caras que los modelos normales. Por ahora, puede habilitar el modo de software CrossFire (sin una tarjeta CrossFire Edition) en tarjetas de video radeon X1300, X1600 y X1800 GTO.

También hay otros factores a considerar. Aunque dos tarjetas gráficas trabajando juntas proporcionan un aumento de rendimiento, está lejos de ser el doble. Pero pagarás el doble de dinero. En la mayoría de los casos, el aumento de la productividad es del 20 al 60%. Y en algunos casos, debido a los costos computacionales adicionales para hacer coincidir, no hay ningún aumento. Por esta razón, es poco probable que las configuraciones de varias tarjetas valga la pena con modelos más baratos, ya que la tarjeta gráfica más cara normalmente siempre superará a un par de tarjetas más baratas. En general, para la mayoría de los consumidores, comprar una solución SLI/CrossFire no tiene sentido. Pero si desea habilitar todas las opciones de mejora de calidad o jugar en resoluciones extremas, por ejemplo, 2560x1600, cuando necesita calcular más de 4 millones de píxeles por cuadro, entonces no puede prescindir de dos o cuatro tarjetas de video emparejadas.

Características visuales

Además de las especificaciones puramente de hardware, las diferentes generaciones y modelos de GPU pueden diferir en el conjunto de funciones. Por ejemplo, a menudo se dice que las tarjetas de generación ATi Radeon X800 XT son compatibles con Shader Model 2.0b (SM), mientras que la nVidia GeForce 6800 Ultra es compatible con SM 3.0, aunque sus especificaciones de hardware son cercanas entre sí (16 pipelines ). Por tanto, muchos consumidores optan por una solución u otra sin siquiera saber cuál es la diferencia.

Versiones de Microsoft DirectX y Shader Model

Estos nombres se utilizan con mayor frecuencia en disputas, pero pocas personas saben lo que realmente significan. Para entenderlo, comencemos con la historia de las API de gráficos. DirectX y OpenGL son API de gráficos, es decir, interfaces de programación de aplicaciones: estándares de código abierto disponibles para todos.

Antes de la llegada de las API de gráficos, cada fabricante de GPU utilizaba su propio mecanismo para comunicarse con los juegos. Los desarrolladores tuvieron que escribir código separado para cada GPU que querían admitir. Un enfoque muy costoso e ineficaz. Para resolver este problema, se desarrollaron API para gráficos 3D de modo que los desarrolladores escribieran código para una API específica y no para una tarjeta de video en particular. Después de eso, los problemas de compatibilidad recayeron sobre los fabricantes de tarjetas de video, quienes debían asegurarse de que los controladores fueran compatibles con la API.

La única dificultad sigue siendo que hoy en día se utilizan dos API diferentes: Microsoft DirectX y OpenGL, donde GL significa Biblioteca de gráficos. Dado que la API DirectX es más popular en los juegos actuales, nos centraremos en ella. Y esta norma tuvo una mayor influencia en el desarrollo de los juegos.

DirectX es una creación de Microsoft. De hecho, DirectX incluye varias API, de las cuales sólo una se utiliza para gráficos 3D. DirectX incluye API para sonido, música, dispositivos de entrada, etc. La API Direct3D es responsable de los gráficos 3D en DirectX. Cuando hablan de tarjetas de video, esto es lo que quieren decir, por lo que en este sentido los conceptos DirectX y Direct3D son intercambiables.

DirectX se actualiza periódicamente a medida que avanza la tecnología de gráficos y los desarrolladores de juegos implementan nuevas técnicas de programación de juegos. A medida que DirectX creció rápidamente en popularidad, los fabricantes de GPU comenzaron a adaptar los lanzamientos de nuevos productos para adaptarse a las capacidades de DirectX. Por esta razón, las tarjetas de video a menudo están vinculadas al soporte de hardware para una u otra generación de DirectX (DirectX 8, 9.0 o 9.0c).

Para complicar las cosas, partes de la API de Direct3D pueden cambiar con el tiempo sin cambiar las generaciones de DirectX. Por ejemplo, la especificación DirectX 9.0 especifica compatibilidad con Pixel Shader 2.0. Pero la actualización de DirectX 9.0c incluye Pixel Shader 3.0. Entonces, aunque las tarjetas son de clase DirectX 9, pueden admitir diferentes conjuntos de funciones. Por ejemplo, la Radeon 9700 es compatible con Shader Model 2.0 y la Radeon X1800 es compatible con Shader Model 3.0, aunque ambas tarjetas pueden clasificarse como DirectX de novena generación.

Recuerda que a la hora de crear nuevos juegos los desarrolladores tienen en cuenta a los propietarios de máquinas y tarjetas de vídeo antiguas, ya que si ignoras a este segmento de usuarios, el nivel de ventas será menor. Por esta razón, los juegos incluyen múltiples rutas de código. Un juego de clase DirectX 9 probablemente tenga una ruta DirectX 8 e incluso una ruta DirectX 7 para compatibilidad. Por lo general, si se selecciona la ruta anterior, algunos de los efectos virtuales que están presentes en las nuevas tarjetas de video desaparecen del juego. Pero al menos puedes jugar incluso en hardware antiguo.

Muchos juegos nuevos requieren la instalación de la última versión de DirectX, incluso si la tarjeta de video es de una generación anterior. Es decir, un juego nuevo que utilice la ruta DirectX 8 aún requerirá la instalación de la última versión de DirectX 9 para una tarjeta de video de clase DirectX 8.

¿Cuáles son las diferencias entre las diferentes versiones de la API Direct3D en DirectX? Las primeras versiones de DirectX (3, 5, 6 y 7) eran relativamente simples en las capacidades de la API Direct3D. Los desarrolladores podrían elegir efectos visuales de la lista y luego verifique su funcionamiento en el juego. El siguiente gran paso en la programación de gráficos fue DirectX 8. Introdujo la capacidad de programar la tarjeta de video usando sombreadores, por lo que los desarrolladores tuvieron por primera vez la libertad de programar los efectos de la manera que necesitaran. Versiones compatibles con DirectX 8 de Pixel Shader 1.0 a 1.3 y Vertex Shader 1.0. DirectX 8.1, una versión actualizada de DirectX 8, recibió Pixel Shader 1.4 y Vertex Shader 1.1.

En DirectX 9 puedes crear programas de sombreado aún más complejos. DirectX 9 es compatible con Pixel Shader 2.0 y Vertex Shader 2.0. DirectX 9c, una versión actualizada de DirectX 9, incluía la especificación Pixel Shader 3.0.

DirectX 10, la próxima versión API, acompañará nueva versión Windows Vista. No puede instalar DirectX 10 en Windows XP.

Iluminación HDR y OpenEXR HDR

HDR significa "alto rango dinámico". Un juego con iluminación HDR puede producir una imagen mucho más realista que un juego sin ella, y no todas las tarjetas de video admiten iluminación HDR.

Antes de la llegada de las tarjetas gráficas DirectX 9, las GPU estaban gravemente limitadas por la precisión de sus cálculos de iluminación. Hasta ahora, la iluminación sólo se podía calcular con 256 niveles internos (8 bits).

Cuando aparecieron las tarjetas de video DirectX 9, pudieron producir iluminación con alta precisión: 24 bits completos o 16,7 millones de niveles.

Con 16,7 millones de niveles y el siguiente paso en el rendimiento de las tarjetas de video DirectX 9/Shader Model 2.0, la iluminación HDR se hizo posible en las computadoras. Esta es una tecnología bastante compleja y es necesario observarla en dinámica. si hablamos en palabras simples, luego la iluminación HDR aumenta el contraste (los tonos oscuros aparecen más oscuros, los tonos claros aparecen más claros), al tiempo que aumenta la cantidad de detalles de iluminación en áreas oscuras y claras. El juego con iluminación HDR parece más vibrante y realista que sin ella.

Las GPU que cumplen con la última especificación Pixel Shader 3.0 permiten cálculos de iluminación de mayor precisión de 32 bits y combinación de punto flotante. Por lo tanto, las tarjetas de video de clase SM 3.0 pueden admitir un método de iluminación especial OpenEXR HDR diseñado específicamente para la industria cinematográfica.

Algunos juegos que solo admiten iluminación OpenEXR HDR no se ejecutarán con iluminación HDR en tarjetas gráficas Shader Model 2.0. Sin embargo, los juegos que no dependen del método OpenEXR se ejecutarán en cualquier tarjeta gráfica DirectX 9. Por ejemplo, Oblivion utiliza el método OpenEXR HDR y solo permite la iluminación HDR en las tarjetas gráficas más recientes que admiten la especificación Shader Model 3.0. Por ejemplo, nVidia GeForce 6800 o ATi Radeon X1800. Los juegos que utilizan el motor 3D de Half-Life 2, incluido Counter-Strike: Source y el próximo Half-Life 2: Aftermath, permiten habilitar la renderización HDR en tarjetas gráficas DirectX 9 más antiguas que solo admiten Pixel Shader 2.0. Los ejemplos incluyen la línea GeForce 5 o ATi Radeon 9500.

Finalmente, tenga en cuenta que todas las formas de renderizado HDR requieren una gran potencia de procesamiento y pueden poner de rodillas incluso a las GPU más potentes. Si quieres jugar a los últimos juegos con iluminación HDR, los gráficos de alto rendimiento son imprescindibles.

Antialiasing de pantalla completa

El suavizado de pantalla completa (AA para abreviar) le permite eliminar las características "escaleras" en los límites de los polígonos. Pero hay que tener en cuenta que el suavizado de pantalla completa consume muchos recursos informáticos, lo que provoca una caída en la velocidad de fotogramas.

El suavizado depende en gran medida del rendimiento de la memoria de video, por lo que una tarjeta de video de alta velocidad con memoria rápida podrá calcular el suavizado de pantalla completa con menos impacto en el rendimiento que una tarjeta de video económica. El antialiasing se puede habilitar en varios modos. Por ejemplo, el antialiasing 4x producirá una mejor imagen que el antialiasing 2x, pero supondrá un gran impacto en el rendimiento. Mientras que el antialiasing 2x duplica la resolución horizontal y vertical, el modo 4x la cuadriplica.

Filtrado de texturas

Las texturas se aplican a todos los objetos 3D del juego y cuanto mayor sea el ángulo de la superficie mostrada, más distorsionada se verá la textura. Para eliminar este efecto, las GPU utilizan filtrado de texturas.

El primer método de filtrado se llamó bilineal y producía franjas características que no eran muy agradables a la vista. La situación mejoró con la introducción del filtrado trilineal. Ambas opciones funcionan en tarjetas de video modernas prácticamente sin penalización en el rendimiento.

lo mas de hoy la mejor manera El filtrado de texturas es un filtrado anisotrópico (AF). Al igual que el antialiasing de pantalla completa, el filtrado anisotrópico se puede habilitar en diferentes niveles. Por ejemplo, 8x AF ofrece más alta calidad filtrado que 4x AF. Al igual que el antialiasing de pantalla completa, el filtrado anisotrópico requiere una cierta cantidad de potencia de procesamiento, que aumenta a medida que aumenta el nivel de AF.

Texturas de alta resolución

Todos los juegos 3D se crean con especificaciones específicas en mente, y uno de esos requisitos determina la memoria de textura que necesitará el juego. Todas las texturas necesarias deben caber en la memoria de la tarjeta de video durante el juego; de lo contrario, el rendimiento disminuirá significativamente, ya que el acceso a la textura en la RAM provoca un retraso considerable, sin mencionar el archivo de paginación en el disco duro. Por lo tanto, si un desarrollador de juegos cuenta con 128 MB de memoria de vídeo como requerimiento mínimo, entonces el conjunto de texturas activas no debe exceder los 128 MB en ningún momento.

Los juegos modernos tienen varios conjuntos de texturas, por lo que el juego se ejecutará sin problemas en tarjetas de video más antiguas con menos memoria de video, así como en tarjetas nuevas con más memoria de video. Por ejemplo, un juego puede contener tres conjuntos de texturas: de 128 MB, 256 MB y 512 MB. Hoy en día existen muy pocos juegos que admitan 512 MB de memoria de video, pero siguen siendo la razón más objetiva para comprar una tarjeta de video con esta cantidad de memoria. Si bien el aumento de memoria tiene poco o ningún impacto en el rendimiento, te beneficiarás de una calidad visual mejorada si el juego admite el conjunto adecuado de texturas.

¿Qué necesitas saber sobre las tarjetas de video?

En contacto con

Las unidades de sombreado unificadas combinan los dos tipos de unidades enumerados anteriormente; pueden ejecutar programas de vértices y píxeles (así como geométricos, que aparecieron en DirectX 10). La unificación de bloques de sombreado significa que el código de diferentes programas de sombreado (vértice, píxel y geometría) es universal y los procesadores unificados correspondientes pueden ejecutar cualquiera de los programas anteriores. En consecuencia, en las nuevas arquitecturas, el número de unidades de sombreado de píxeles, vértices y geometría parece fusionarse en un solo número: el número de procesadores universales.

Unidades de texturizado (tmu)

Estos bloques funcionan junto con procesadores de sombreado de todos los tipos especificados; seleccionan y filtran los datos de textura necesarios para construir la escena. La cantidad de unidades de textura en el chip de video determina el rendimiento de la textura, la velocidad de muestreo de las texturas. Y aunque recientemente la mayoría de los cálculos se realizan mediante unidades de sombreado, la carga en las TMU sigue siendo bastante alta y, dado el énfasis de algunas aplicaciones en el rendimiento de las unidades de texturizado, podemos decir que el número de TMU y la alta textura correspondiente El rendimiento es uno de los parámetros más importantes de los chips de vídeo. Este parámetro tiene un impacto particular en la velocidad cuando se utiliza filtrado trilineal y anisotrópico, que requieren muestras de textura adicionales.

Bloques de operación de rasterización (rop)

Las unidades de rasterización realizan las operaciones de escribir píxeles calculados por la tarjeta de video en buffers y las operaciones de mezclarlos (blending). Como se señaló anteriormente, el rendimiento de los bloques ROP afecta la tasa de llenado y esta es una de las principales características de las tarjetas de video. Y aunque su importancia ha disminuido un poco recientemente, todavía hay casos en los que el rendimiento de la aplicación depende en gran medida de la velocidad y la cantidad de bloques ROP. En la mayoría de los casos, esto se debe al uso activo de filtros de posprocesamiento y suavizado habilitados en configuraciones de imagen altas.

Capacidad de memoria de vídeo

Los chips de video utilizan su propia memoria para almacenar los datos necesarios: texturas, vértices, buffers, etc. Parecería que cuanto más haya, mejor. Pero no es tan simple: estimar la potencia de una tarjeta de video basándose en la cantidad de memoria de video es el error más común. Los usuarios inexpertos suelen sobrestimar el valor de la memoria y la utilizan para comparar diferentes modelos de tarjetas de vídeo. Esto es comprensible: dado que el parámetro, uno de los primeros indicados en todas las fuentes, es el doble de grande, entonces la velocidad de la solución debería ser el doble, creen. La realidad difiere de este mito en que el crecimiento de la productividad crece hasta cierto volumen y, una vez alcanzado ese nivel, simplemente se detiene.

Cada aplicación tiene una cierta cantidad de memoria de video, que es suficiente para todos los datos, e incluso si pones 4 GB allí, no habrá ninguna razón para acelerar el renderizado, la velocidad estará limitada por las unidades de ejecución. Es por eso que, en casi todos los casos, una tarjeta de video con 320 MB de memoria de video funcionará a la misma velocidad que una tarjeta con 640 MB (en igualdad de condiciones). Hay situaciones en las que más memoria conduce a un aumento visible del rendimiento; se trata de aplicaciones muy exigentes con resoluciones altas y configuraciones máximas. Pero estos casos son muy raros, por lo que, por supuesto, es necesario tener en cuenta la cantidad de memoria, pero sin olvidar que el rendimiento simplemente no aumenta por encima de cierta cantidad, hay parámetros más importantes, como el ancho del bus de memoria. y su frecuencia de operación.

Cada día en nuestro foro decenas de personas piden consejos para modernizar sus máquinas, y nosotros les ayudamos con mucho gusto. Todos los días, “evaluando el ensamblaje” y verificando la compatibilidad de los componentes elegidos por nuestros clientes, comenzamos a notar que los usuarios prestan atención principalmente a otros componentes, sin duda importantes. Y rara vez alguien recuerda que al actualizar una computadora, es necesario actualizar una parte igualmente importante:. Y hoy te contaremos y mostraremos por qué no debes olvidarte de esto.

“...Quiero actualizar mi computadora para que todo funcione, compré una placa base i7-3970X y ASRock X79 Extreme6, además de una tarjeta de video RADEON HD 7990 de 6GB. ¿Qué más es nan????777"
- así es como comienzan aproximadamente la mitad de todos los mensajes relacionados con la actualización computadora de escritorio. Según su presupuesto o el de su familia, los usuarios intentan elegir los módulos de memoria más rápidos, rápidos y bonitos. Al mismo tiempo, creyendo ingenuamente que su antiguo modelo de 450 W podrá hacer frente tanto a una tarjeta de video que consume mucha energía como a un procesador "caliente" durante el overclocking al mismo tiempo.

Nosotros, por nuestra parte, ya hemos escrito más de una vez sobre la importancia del suministro de energía, pero, confesamos, probablemente no quedó lo suficientemente claro. Por eso, hoy nos hemos corregido y hemos preparado para usted un recordatorio sobre lo que sucederá si lo olvida al actualizar su PC, con imágenes y descripciones detalladas.

Entonces, decidimos actualizar la configuración...


Para nuestro experimento, decidimos tomar una computadora promedio completamente nueva y actualizarla al nivel de "máquina de juegos". No es necesario cambiar mucho la configuración: bastará con cambiar la memoria y la tarjeta de video para que podamos jugar juegos más o menos modernos con una configuración detallada decente. La configuración inicial de nuestro ordenador es la siguiente:

Unidad de poder: ATX 12V 400W

Está claro que para los juegos esta configuración es, por decirlo suavemente, bastante débil. ¡Así que es hora de cambiar algo! Comenzaremos con lo mismo con lo que comienzan la mayoría de los que desean una "actualización": con. No cambiaremos la placa base, siempre que nos convenga.

Como decidimos no tocar la placa base, seleccionaremos una que sea compatible con el zócalo FM2 (afortunadamente, hay un botón especial para esto en el sitio web de NICS en la página de descripción de la placa base). No seamos codiciosos: tomemos un procesador asequible, pero rápido y potente con una frecuencia de 4,1 GHz (hasta 4,4 GHz en modo Turbo CORE) y un multiplicador desbloqueado; también nos encanta hacer overclock, nada humano nos es ajeno. Estas son las características del procesador que elegimos:

Características
frecuencia del bus de la CPU 5000MHz Disipación de potencia 100W Frecuencia del procesador 4,1 GHz o hasta 4,4 GHz en modo Turbo CORE Centro tierra rica caché L1 96 KB x2 caché L2 2048 KB x2, funcionando a la velocidad del procesador soporte de 64 bits Numero de nucleos 4 Multiplicación 41, multiplicador desbloqueado Núcleo de vídeo del procesador AMD Radeón HD 8670D con una frecuencia de 844 MHz; Soporte para Shader Model 5 maximo volumen memoria de acceso aleatorio 64GB Máx. número de monitores conectados 3 monitores conectados directamente o hasta 4 mediante divisores DisplayPort

Un dispositivo de 4 GB no es nuestra elección. En primer lugar, queremos 16 GB, y en segundo lugar, necesitamos utilizar el modo de funcionamiento de doble canal, para lo cual instalaremos dos módulos de memoria de 8 GB cada uno en nuestro ordenador. El alto rendimiento, la falta de radiadores y un precio decente los convierten en la opción más "deliciosa" para nosotros. Además, desde el sitio web de AMD puede descargar el programa Radeon RAMDisk, que nos permitirá crear una unidad virtual súper rápida de hasta 6 GB de forma totalmente gratuita, y a todo el mundo le encantan las cosas útiles y gratuitas.


Características
Memoria 8GB
Número de módulos 2
Estándar de memoria PC3-10600 (DDR3 1333MHz)
Frecuencia de operación hasta 1333MHz
Horarios 9-9-9-24
Tensión de alimentación 1,5 voltios
Banda ancha 10667 MB/s

Puedes reproducir cómodamente el vídeo incorporado sólo en “buscaminas”. Por lo tanto, para actualizar su computadora a un nivel de juego, elegimos una moderna y potente, pero no la más cara.


Viene con 2 GB de memoria de video, soporte para DirectX 11 y OpenGL 4.x. y un excelente sistema de refrigeración Twin Frozr IV. Su rendimiento debería ser más que suficiente para que podamos disfrutar de las últimas entregas de las franquicias de juegos más populares, como Tomb Raider, Crysis, Hitman y Muy lejos. Las características del que hemos elegido son las siguientes:


Características
GPU GeForce GTX 770
frecuencia de GPU 1098 MHz o hasta 1150 MHz en modo GPU Boost
Número de procesadores de sombreado 1536
Memoria de video 2GB
Tipo de memoria de vídeo GDDR5
Ancho del bus de memoria de video 256 bits
Frecuencia de la memoria de vídeo 1753 MHz (QDR de 7,010 GHz)
Número de canalizaciones de píxeles 128, 32 unidades de muestreo de textura
Interfaz PCI Express 3.0 16x (compatible con PCI Express 2.x/1.x) con capacidad de combinar tarjetas mediante SLI.
Puertos Adaptador DisplayPort, DVI-D, DVI-I, HDMI, D-Sub incluido
Enfriando la tarjeta de video Activo (disipador + 2 ventiladores Twin Frozr IV en la parte frontal de la placa)
Conector de alimentación 8 pines+8 pines
Soporte API DirectX 11 y OpenGL 4.x
Longitud de la tarjeta de video (medida en NICS) 263 milímetros
Soporte para computación GPU de uso general DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Consumo máximo de energía FurMark+WinRar 255 vatios
Clasificación de Rendimiento 61.5

Dificultades inesperadas

Ahora tenemos todo lo que necesitamos para actualizar nuestra computadora. Instalaremos nuevos componentes en nuestra caja existente.


Lo lanzamos y no funciona. ¿Y por qué? Pero debido a que las fuentes de alimentación económicas no son físicamente capaces de ejecutar una computadora con energía. El hecho es que en nuestro caso, la fuente de alimentación requiere dos conectores de 8 pines, y la fuente de alimentación tiene solo un conector de alimentación de tarjeta de video de 6 pines en su base. Teniendo en cuenta que muchas personas necesitan incluso más conectores que en nuestro caso, queda claro que es necesario cambiar la fuente de alimentación.

Pero eso no es tan malo. ¡Piénselo, no hay conector de alimentación! En nuestro laboratorio de pruebas encontramos adaptadores bastante raros de 6 pines a 8 pines y de Molex a 6 pines. Como estos:


Vale la pena señalar que incluso en las fuentes de alimentación modernas y económicas, con cada nueva versión de conectores Molex, cada vez hay menos conectores Molex, por lo que podemos decir que tenemos suerte.

A primera vista todo está bien y con algunos trucos pudimos actualizar unidad del sistema a la configuración “gamer”. Ahora simulemos la carga ejecutando la prueba Furmark y el archivador 7Zip en modo Xtreme Burning simultáneamente en nuestra nueva computadora para juegos. Podríamos iniciar la computadora, ya está bien. El sistema también sobrevivió al lanzamiento de Furmark. Lanzamos el archivador, ¿y qué es? El ordenador se apagó, deleitándonos con el rugido de un ventilador al máximo. El "modesto" estándar de 400W no pudo, por mucho que lo intentara, alimentar la tarjeta de video y el potente procesador. Y debido al mediocre sistema de refrigeración, el nuestro se calentó mucho, e incluso la velocidad máxima del ventilador no le permitió producir al menos los 400W declarados.

¡Hay una salida!

Hemos llegado. Compramos componentes costosos para ensamblar una computadora para juegos, pero resulta que no podemos jugar en ella. Es una pena. La conclusión es clara para todos: el viejo no es adecuado para nuestra computadora de juegos y es necesario reemplazarlo urgentemente por uno nuevo. ¿Pero cuál exactamente?

Para nuestra computadora actualizada, elegimos según cuatro criterios principales:

El primero es, por supuesto, el poder. Preferimos elegir con una reserva: nos gustaría overclockear el procesador y ganar puntos en las pruebas sintéticas. Teniendo en cuenta todo lo que podamos necesitar en el futuro, decidimos elegir una potencia de al menos 800W.

El segundo criterio es la confiabilidad.. Realmente queremos que el que se toma "con reserva" sobreviva a la próxima generación de tarjetas de video y procesadores, no se queme por sí solo y, al mismo tiempo, no queme componentes costosos (junto con la plataforma de prueba). Por lo tanto, nuestra elección son solo condensadores japoneses, solo protección contra cortocircuitos y protección confiable contra sobrecargas de cualquiera de las salidas.

El tercer punto de nuestros requisitos es la comodidad y la funcionalidad.. Para empezar, necesitamos: la computadora funcionará con frecuencia y las fuentes de alimentación especialmente ruidosas, junto con una tarjeta de video y un enfriador de procesador, volverán loco a cualquier usuario. Además, el sentimiento de belleza no nos es ajeno, por eso nuevo bloque La fuente de alimentación de nuestro ordenador gaming debe ser modular y disponer de cables y conectores desmontables. Para que no quede nada superfluo.

Y por último en la lista, pero no menos importante, el criterio es eficiencia energética. Sí, nos importa y ambiente y facturas de electricidad. Por tanto, la fuente de alimentación que elijamos debe cumplir al menos con el estándar de eficiencia energética 80+ Bronze.

Después de comparar y analizar todos los requisitos, elegimos, entre los pocos solicitantes, el que mejor cumplía con todos nuestros requisitos. Pasó a tener una potencia de 850W. Tenga en cuenta que en varios parámetros incluso superó nuestros requisitos. Veamos su especificación:

Características de la fuente de alimentación
Tipo de equipamiento Fuente de alimentación con módulo PFC (Corrección del Factor de Potencia) activo.
Propiedades Trenzado en bucle, Condensadores japoneses, Protección contra cortocircuitos (SCP), Protección contra sobretensión (OVP), Protección contra sobrecarga de cualquiera de las salidas de la unidad de forma individual (OCP)
+3,3 V - 24 A, +5 V - 24 A, +12 V - 70 A, +5 VSB - 3,0 A, -12 V - 0,5 A
Cables de alimentación desmontables
Eficiencia 90%, certificación 80 PLUS Gold
Fuente de alimentación 850W
Conector de alimentación de la placa base 24+8+8 pines, 24+8+4 pines, 24+8 pines, 24+4 pines, 20+4 pines (conector desmontable de 24 pines. El de 4 pines se puede desconectar si es necesario, conector desmontable de 8 pines)
Conector de alimentación de la tarjeta de vídeo Conectores de 6x 6/8 pines (conector de 8 pines desmontable - 2 pines desmontables)
MTBF 100 mil horas
Enfriar la fuente de alimentación 1 ventilador: 140 x 140 mm (en la pared inferior). Sistema de refrigeración pasiva con carga de hasta el 50%.
Control de velocidad del ventilador Del sensor de temperatura. Cambiando la velocidad del ventilador dependiendo de la temperatura dentro de la fuente de alimentación. Selección manual del modo de funcionamiento del ventilador. En modo Normal, el ventilador gira constantemente y en modo Silencioso se detiene por completo con poca carga.


, uno de los mejores por el dinero. Instalémoslo en nuestro caso:


Entonces sucedió algo que nos confundió un poco. Parecería que todo estaba montado correctamente, todo estaba conectado, todo funcionaba, ¡pero la fuente de alimentación está en silencio! Es decir, en general: el ventilador ha estado parado y sigue parado, y el sistema ha arrancado correctamente y está funcionando. El hecho es que con una carga de hasta el 50%, la fuente de alimentación funciona en el llamado modo silencioso, sin hacer girar el ventilador del sistema de refrigeración. El ventilador solo zumbará bajo una carga pesada: el lanzamiento simultáneo de Archivers y Furmark aún hizo que el refrigerador girara.


La fuente de alimentación tiene hasta seis conectores de alimentación de tarjeta de video de 8 pines y 6 pines, cada uno de los cuales es un conector plegable de 8 pines, del cual se pueden desconectar 2 pines si es necesario. Por lo tanto, es capaz de alimentar cualquier tarjeta de video sin ningún problema o dificultad. Y ni siquiera uno.


El sistema de alimentación modular permite desatar cables de alimentación innecesarios y sobrantes, lo que mejora el flujo de aire de la carcasa, la estabilidad del sistema y, por supuesto, mejora la estética. apariencia espacio interno, lo que nos permite recomendarlo con seguridad a modders y fanáticos de las carcasas con ventanas.
compre una fuente de alimentación confiable y potente. En nuestra revisión se convirtió. - y como puedes ver, no es una coincidencia. Al comprar uno de NICS, puede estar seguro de que todos los componentes de su sistema de alto rendimiento recibirán energía suficiente e ininterrumpida, incluso bajo overclocking extremo.


Además, la fuente de alimentación tendrá suficiente potencia para varios años; es mejor tener una reserva en caso de que vaya a actualizar el sistema con componentes de alto nivel en el futuro.

Arriba