TESLA

GIS FEDERAL REVOLUCIONA LA CAPACIDAD DE ACCESO A LOS DATOS GEOESPACIALES

La base de datos GAIA acelerada en la GPU proporciona visualización y análisis de datos en tiempo real

PERFIL DEL CLIENTE

  • GIS Federal es una compañía especializada en arquitecturas de sistemas empresariales, informática en la nube y sistemas de gestión y análisis de cantidades masivas de datos

RETOS DEL PROYECTO

  • Crear un sistema para proporcionar al ejército acceso en tiempo casi real a diferentes datos geoespaciales en lugares remotos

SOLUCIÓN DE NVIDIA

  • La aceleración en GPUs NVIDIA® con arquitectura CUDA abrió nuevas posibilidades de consulta



En 2009, la posibilidad de acceder a datos geoespaciales almacenados en la nube en tiempo real estaba fuera del alcance incluso de los sistemas informáticos más avanzados. En aquella época, GIS Federal inició un proyecto de investigación para las fuerzas armadas cuyo objetivo era filtrar 10 millones de puntos de una zona de interés dada. Consiguieron su objetivo y crearon un sistema basado en CPUs que filtraba los puntos necesarios en 92 minutos. No obstante, GIS Federal se dio cuenta de las desventajas que conllevaba utilizar CPUs para analizar grandes cantidades de datos. Las tareas de supercomputación basadas en la GPU proporcionan una mejora tremenda de la capacidad de cálculo, al tiempo que reducen los costes de consumo energético del hardware. Las GPUs acortan el tiempo de procesamiento de los sistemas de información geográfica (SIG) de horas a minutos y de minutos a segundos. Esto permite a los usuarios ejecutar tareas complejas en entornos basados en la web y conseguir así más capacidad de procesamiento en lugares remotos.

En geografías alejadas o en conflicto, es fundamental poder acceder a la información de inteligencia en el instante preciso, así que es esencial reducir el tiempo entre la captación y la entrega de los datos. Amit Vij, CEO de GIS Federal, habla así de lo que representan las GPUs para sus proyectos: “Utilizando la potencia de las GPUs, podemos suministrar datos de 1000 millones de puntos geoespaciales correspondientes a una zona de interés definida en menos de 2 segundos desde un portátil, y eso era en 2010. La combinación de nuestra base de datos patentada GAIA y un sistema basado en GPUs cambia las reglas del acceso a datos de inteligencia geoespacial”.

Un diseño de base de datos patentado aprovecha la aceleración en la GPU

GIS Federal

Foto aérea de rutas que muestra la capacidad de rasterización de grandes cantidades de datos con las GPUs. En lugar de proporcionar una cantidad limitada de datos en el navegador web, GIS Federal tiene capacidad para mostrar todos los datos creando un archivo ráster o una imagen PNG de 4 kb al instante.

GAIA es una base de datos distribuida que está especialmente diseñada para un motor multinúcleo. Nima Negahban, máximo responsable de tecnología de GIS Federal, explica su funcionamiento: “La diferencia con GAIA es que nosotros vinculamos los procesos generados por la GPU a los datos, algo que da una capacidad de consulta hasta ahora imposible con grandes conjuntos de datos. Con GAIA, puedes incluir funciones de consulta como "join" (unir) y "group by" (agrupar por) y esto abre una nueva dimensión en el campo del análisis. El desarrollador no necesita crear índices o precalcular cada combinación posible de valores absolutos y variables. La mayoría de los sistemas de big data solo pueden darte un puntero a una lista muy larga. Si preguntas cuántos elementos hay en esa lista, tendrás que esperar bastante tiempo a que llegue la respuesta, pero GAIA vincula los procesos de la GPU a los datos y, por eso, puede hacer todos esos cálculos agregados y complejos extremadamente rápido”.

“Una de las cosas que más claras teníamos cuando empezamos a trabajar en GAIA es que no queríamos que todo el mundo tuviera que conocer CUDA o saber cómo sincronizar datos de múltiples núcleos o máquinas”, continúa Negahban, que termina diciendo: “Lo abstrajimos todo de manera que GAIA actuase en gran parte como una base de datos tradicional en la que pones los datos, te dan una API de consulta y puedes tratar de hacer lo que quieras sin tener que conocer los entresijos de la tarjeta o el cluster”.

Acceso en tiempo casi real a análisis predictivo en ubicaciones remotas

Cualquier desarrollador que utilice GAIA puede añadir objetos de una gran variedad de fuentes y esquemas, y posee acceso instantáneo a consultas complicadas de cualquier diseño o combinación de datos sin tener que esperar a la indexación, incluso desde ubicaciones remotas. Vij prosigue diciendo: “Antes, solo se preocupaban de lo que había dentro de la zona de interés y quizá ejecutaban análisis predictivos que podían corresponder al último o los tres últimos días. Esta operación podía tardar minutos u horas, en función de la cantidad de datos que estuvieran manejando. Ahora, los analistas de campo tienen todo el control. Pueden activar y desactivar, ajustar y cambiar múltiples variables en los cálculos para llegar a los datos que están buscando con enorme rapidez. Tareas que antes tardaban horas o días, ahora pueden ejecutarse en tiempo casi real”.

Como ejemplo, GAIA permite a los usuarios efectuar análisis de tendencias y predictivos para detectar la posible presencia de explosivos utilizando el historial de artefactos que han estallado en ciertas rutas. Esta información puede utilizarse en las rutas de suministro principales y secundarias de las misiones. También hay un sistema de alertas que puede mostrar las mejores rutas casi en tiempo real basándose en acontecimientos recientes. “Los vehículos crean un punto cada segundo”, afirma Vij, “Esto da como resultado millones de trayectos con miles de millones de puntos. La base de datos GAIA acelerada en la GPU puede realizar en la memoria cálculos que llevarían años en un sistema basado en CPUs. Con un UV 2000 de SGI y tarjetas gráficas K20X de NVIDIA, tenemos 43.000 núcleos físicos y 10 terabytes de RAM. Esto permite realizar un número tal de operaciones en coma flotante por segundo que sería imposible en un sistema basado únicamente en CPUs”.

Fusión de datos y otros hitos en el horizonte de GAIA

En el futuro será posible realizar más análisis y crear más algoritmos. Vij concluye afirmando lo siguiente: “Se están abriendo tantas puertas... Ahora podemos ver qué puntos están conectados con otros puntos. Podemos crear vídeos de mapas de calor con referencias de tiempo y rasterizar resultados complejos en imágenes o vídeos sobre un mapa en tan solo un segundo. Este tipo de operaciones antes eran imposibles. Las funciones avanzadas de creación de tipos de objetos de GAIA abren numerosas oportunidades de fusión de datos, algo que también resulta muy prometedor. Se podrá ejecutar una misma consulta con múltiples tipos de datos y esquemas, y el sistema de creación de tipos de objetos de la base de datos entenderá cómo combinar esos tipos aparentemente inconexos en un todo conciso y fusionado”.