La investigación científica contemporánea vive un momento de profunda transformación, donde la capacidad para procesar macrodatos (Big Data), ejecutar simulaciones físicas complejas y acelerar modelos de inteligencia artificial se ha vuelto un requisito indispensable. En este escenario global, el supercómputo ha dejado de ser una herramienta de uso exclusivo para laboratorios gubernamentales aislados, consolidándose como una pieza clave para el desarrollo científico, tecnológico y académico de las regiones.
Un ejemplo destacado de este avance en México es ‘Yuca’, el clúster de cómputo de alto rendimiento (HPC) de la Universidad de Sonora (UNISON). Administrado por el Área de Cómputo de Alto Rendimiento (ACARUS), este superordenador ha democratizado el acceso a capacidades de procesamiento masivo para una comunidad activa de 536 usuarios, entre los que se encuentran alrededor de 200 investigadores de tiempo completo que utilizan el sistema de manera intensiva.
Arquitectura de vanguardia y rendimiento en Petaflops
Para dar soporte a cargas de trabajo científicas de extrema exigencia, el clúster combina la ingeniería de hardware de AMD y servidores Dell PowerEdge de última generación. Esta arquitectura permite la ejecución de cálculos en paralelo con un alto nivel de eficiencia energética.
La plataforma está integrada por un ecosistema de 40 servidores Dell PowerEdge de doble socket, distribuidos de la siguiente manera:
- 30 servidores PowerEdge serie R: Equipados con procesadores AMD EPYC™ 9354 de 4.ª generación, destinados al procesamiento masivo de datos.
- 4 servidores PowerEdge serie R: Configurados con procesadores AMD EPYC™ 9124, dedicados a las funciones críticas de control de acceso y gestión de nodos maestros.
- 6 servidores Dell PowerEdge serie XE: Impulsados por procesadores AMD EPYC™ 9224, los cuales incorporan dos aceleradores gráficos (GPU) AMD Instinct™ MI210 cada uno, optimizados para tareas analíticas y de Inteligencia Artificial.
Mediante pruebas estandarizadas de la industria, incluyendo la certificación Linpack FP64, la Universidad de Sonora validó un desempeño neto de 1.5 petaflops. No obstante, el sistema cuenta con una capacidad teórica total de 2.3 petaflops (donde $1 \text{ petaflop}$ equivale a $1.000 \text{ billones}$ de operaciones matemáticas por segundo), posicionando a ‘Yuca’ como uno de los nodos de supercómputo orientados a la investigación más potentes de la República Mexicana.
Optimización del tiempo: De años a pocas horas
El impacto real de esta inversión tecnológica se evidencia en la drástica reducción de los tiempos de experimentación lineal. En sus primeros nueve meses de operación continua, ‘Yuca’ ejecutó un acumulado de 1.435.793 horas de procesamiento de CPU, lo que equivale matemáticamente a 163.9 años de cómputo ininterrumpido en un ordenador convencional de un solo núcleo.
“La calidad de la experiencia que tuvimos utilizando procesadores AMD nos dio la confianza para adquirir las GPUs de la marca. Ha sido una excelente decisión elegir la tecnología de AMD tanto para CPU como para GPU en este superclúster. Estamos tan contentos con los resultados de Yuca que ahora somos un referente nacional”. — María del Carmen Heras Sánchez, directora del Área de Cómputo de Alto Rendimiento de la UNISON.
Para ilustrar este salto de rendimiento, las autoridades de ACARUS explicaron que un proceso de simulación avanzado que tardaría cerca de un año en resolverse con hardware estándar, se completa en aproximadamente cuatro horas al distribuir la carga entre los 1.536 núcleos de procesamiento disponibles en el clúster.
Un caso concreto se registró en el Departamento de Física de la UNISON, donde un único proyecto de física de altas energías consumió 335.099 horas de CPU durante nueve meses, lo que representa un ahorro de 38.25 años de tiempo de espera para los científicos.
Impacto social, Inteligencia Artificial y Eficiencia Energética
El espectro de aplicaciones de ‘Yuca’ trasciende las fronteras de la academia y se inserta en proyectos de alto impacto social en México. El superordenador es una de las bases de cómputo del proyecto LLM-MX, un modelo de lenguaje de Inteligencia Artificial (LLM) desarrollado en colaboración con el Centro de Investigación en Computación del Instituto Politécnico Nacional (IPN), entrenado desde cero de forma nativa en español y en diversas lenguas indígenas del país. Asimismo, su potencia se aplica en el desarrollo de sistemas de alerta temprana para desastres naturales (sismos, tsunamis e impactos de huracanes), así como en investigaciones de epidemiología y medicina predictiva.
Finalmente, el complejo aborda los desafíos actuales de sostenibilidad en centros de datos. La Universidad de Sonora documentó de forma estricta que el ecosistema completo —que engloba los servidores Dell con CPUs y GPUs AMD, los sistemas de almacenamiento de alta velocidad, los switches de red y los sistemas de enfriamiento por aire acondicionado— opera con un consumo controlado de 696 kW en periodos de 24 horas, demostrando un equilibrio óptimo entre el rendimiento de cómputo por vatio y la huella energética del centro de datos.













Discussion about this post