Los procesadores de cálculo NVIDIA Tesla™ C2050 y C2070 son el motor del cambio a los nuevos sistemas de cálculo paralelo y llevan la potencia de un pequeño clúster a los sistemas de sobremesa. La familia de GPUs Tesla de la serie 20 se basa en la arquitectura CUDA de última generación (“Fermi”) e incorpora numerosas funciones imprescindibles para los sistemas de cálculo de entornos empresariales y técnicos, lo que incluye soporte de C++, memoria ECC para proporcionar máxima precisión y escalabilidad, y 7 veces más rendimiento en operaciones de coma flotante de doble precisión que los productos de la serie Tesla 10. Las GPUs Tesla™ C2050 y C2070 están diseñadas para redefinir el cálculo de alto rendimiento y poner la supercomputación al alcance de todos.
Si los comparamos con las CPUs de cuatro núcleos más modernas, los procesadores Tesla C2050 y C2070 ofrecen un rendimiento computacional equivalente por una décima parte de su coste y una vigésima parte de la energía que consumen.
GPU basada en la arquitectura de cálculo paralelo masivo CUDA
Proporciona el mismo rendimiento que un cluster de CPUs de cuatro núcleos de última generación por una décima parte de su coste y una vigésima parte de la energía que consume.
448 núcleos CUDA
Producen hasta 515 Gigaflops de velocidad máxima en operaciones de coma flotante de doble precisión en cada GPU, lo que da lugar a un rendimiento de un Teraflop o más en una sola estación de trabajo. El rendimiento en operaciones de coma flotante de precisión simple supera un Teraflop por GPU.
Memoria ECC
Responde a los requisitos fundamentales de precisión y fiabilidad del cálculo en las estaciones de trabajo. Protege los datos de la memoria para que lleguen íntegros a las aplicaciones. Todos los componentes de memoria (archivos de registro, cachés L1/L2, memoria compartida y DRAM) tienen protección ECC.
El rendimiento de un clúster de sobremesa
Una sola estación de trabajo con múltiples GPUs resuelve problemas a gran escala con más rapidez que un pequeño cluster de servidores.
Hasta 6 GB de memoria GDDR5 por GPU
Maximiza el rendimiento y reduce las transferencias de datos porque mantiene los conjuntos de datos de mayor tamaño en la memoria local que está directamente asociada a la GPU.
NVIDIA Parallel DataCache™
Acelera algoritmos de cálculo físico, trazado de rayos o multiplicación de matrices dispersas en los que las direcciones de datos no se conocen de forma anticipada. Esto incluye una caché L1 configurable por cada bloque de multiprocesadores de streaming y una caché L2 unificada para todos los núcleos de procesamiento.
Motor NVIDIA GigaThread
Maximiza la velocidad de transmisión gracias a cambios de contexto 10 veces más rápidos que en la arquitectura anterior, la ejecución concurrente de kernels y una mejor programación de los bloques de hilos.
Transferencia asíncrona
Acelera el rendimiento del sistema transfiriendo los datos a través del bus PCIe mientras los núcleos de cálculo manejan otros datos. Incluso aplicaciones con altos requisitos de transferencia de datos, como las de simulación de procesos sísmicos, pueden incrementar la eficiencia de los cálculos enviando los datos a la memoria local antes de que sean necesario.
Entorno de programación CUDA compatible con una extensa variedad de lenguajes de programación y APIs
Permite elegir entre C, C++, OpenCL, DirectCompute o Fortran para aplicar el cálculo paralelo a las aplicaciones y aprovechar la novedosa arquitectura de GPU “Fermi”. Herramienta NVIDIA Parallel Nsight disponible para desarrolladores de Microsoft Visual Studio.
Transferencia de datos a alta velocidad mediante el bus PCI Express Gen 2.0
Maximiza el ancho de banda entre el host y los procesadores Tesla. Hace que los sistemas Tesla puedan funcionar prácticamente con cualquier sistema central PCIe que disponga de una ranura PCI Express x16 libre.
Si quiere registrarse para recibir las últimas novedades sobre los productos Tesla y las aplicaciones aceleradas en la GPU, haga clic aquí.