La creciente carga de trabajo y al advenimiento de nuevos y más potentes componentes electrónicos y de ingeniería de sistemas aconsejaban fortalecer este equipamiento, ampliamente utilizado por la comunidad científica en el ámbito del cálculo intensivo. El Vicerrectorado de Digitalización e Infraestructuras de la UCA ha culminado ahora la tercera fase de la implantación de supercomputación.
La Universidad de Cádiz está inmersa en una estrategia transversal de transformación digital de todos sus procesos. En este contexto y para avanzar en este objetivo, se han ampliado las prestaciones de su supercomputador para acometer con garantías esa transformación digital en el ámbito del cálculo intensivo, convirtiéndolo, de este modo, en línea con los más potentes del sistema universitario español. El nuevo sistema es un 675% más potente, pasando de 15,4 a 104 TFlops, billones de operaciones por segundo.
Finalizados los trabajos de instalación necesarios, que se han prolongado unos cinco meses, se ha procedido a la puesta en marcha de la ampliación de ese supercomputador de la Universidad gaditana, un proyecto en el que se han invertido casi 550.000 euros de fondos europeos.
De este modo, se detalla en el comunicado remitido a DIARIO Bahía de Cádiz, el área de Sistemas de la Información del Vicerrectorado de Digitalización e Infraestructuras de la UCA ha culminado la tercera fase de la implantación de supercomputación. Un proceso que arrancó en 2007 cuando se diseñó e implantó el primer equipo de cálculo masivo.
Se trata de una infraestructura ampliamente utilizada por la comunidad científica, tanto de la Universidad de Cádiz como de otras instituciones nacionales e internacionales colaboradoras en la investigación. El clúster disponible hasta ahora ha permitido abordar una amplia gama de problemas inter y multidisciplinares.
Sin embargo, la creciente carga de trabajo y al advenimiento de nuevos y más potentes componentes electrónicos y de ingeniería de sistemas aconsejaban fortalecer este equipamiento. En este sentido, el objetivo del proyecto se ha centrado en la mejora y la ampliación del Clúster de Cálculo Intensivo destinado a fines de investigación, desarrollo e innovación de la UCA.
Desde la Vicegerencia de Transformación Digital se subraya que “estas capacidades computacionales permitirán avanzar aún más en el estudio y desarrollo de disciplinas que, aunque han irrumpido de forma súbita en numerosos campos de la vida diaria, su estudio e investigación se aborda desde hace muchos años en las universidades, como son la inteligencia artificial, y algunas de las técnicas que la sustentan, como el machine learning y el deep learning”. De esta forma, la transformación digital también llega al campo de la supercomputación, donde las técnicas, los sistemas, los algoritmos y las herramientas cambian y se adaptan como consecuencia de la demanda incesante en estas temáticas.
UN SUPERORDENADOR
El nuevo equipamiento está basado en nodos HPE Proliant XL220n Gen 10 Plus que incorporan procesadores Intel(R) Xeon(R) Platinum 8358 CPU @ a 2.60GHz, que cuadruplican el número de núcleos disponibles en el anterior equipo (64), y duplican la memoria de los mismos (256GB). La potencia de cálculo del sistema pasa de 15,4 TFlops (billones de operaciones en coma flotante por segundo) a 104 TFlops, lo que supone un incremento en la potencia de cálculo bruto un 675% superior en comparación con el equipo vigente hasta ahora.
En cuanto a tarjetas gráficas de procesamiento (GPUs), el sistema incorpora ocho tarjetas NVIDIA Tesla A100, que disponen de 40GB de RAM y 6912 núcleos cada una, en lugar de los 5GB de RAM y 2560 núcleos de las dos unidades actuales, lo que multiplica el número de núcleos disponibles por un factor de 10, que serán precisamente dedicados fundamentalmente a ejecutar algoritmos de aprendizaje (machine y deep learning). En cuanto a espacio en disco, el equipo dispondrá de un sistema de ficheros de alta disponibilidad LUSTRE con medio Petabyte de capacidad. Completa el diseño, el uso de una red de cálculo Infiniband de alta velocidad.
Por último, se han instalado y actualizado un total de 49 programas, manteniéndose el gestor de colas SLURM como sistema de gestión de trabajos, en su versión más actualizada, por lo que la transición y adaptación de los usuarios al nuevo sistema se prevé ágil.
Todos los investigadores con cuentas en vigor recibirán en unos días una carta personalizada con las instrucciones de uso.
Como novedad, se ha introducido también un nuevo sistema de gestión de trabajos basado en Open onDemand, una interfaz web que permitirá al investigador la gestión de todos sus trabajos y recursos computacionales de una forma centralizada.