Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

Caída del data center de la Diputación General de Aragón (Aragonesa de Servicios Telemáticos-AST)

POSTED BY Garcerán Rojas 04 de junio de 2019

Un fallo eléctrico registrado en la zona de Walqa, puso en jaque durante un día al sistema informático de la Administración General, al Servicio Aragonés de Salud, al de los juzgados y centros de salud.

AST es el proveedor principal de soluciones e infraestructuras de informática y telecomunicaciones de la Administración de la Comunidad Autónoma de Aragón y, en la noche del pasado día 27 de mayo, tuvo lugar la caída de su data center ubicado en las instalaciones del Parque Tecnológico Walqa, en Huesca, lo que provocó el bloqueo del sistema informático durante todo un día, afectando a la Administración General, en las páginas web oficiales o en el Boletín Oficial de Aragón, al sistema informático del Servicio Aragonés de Salud y de los juzgados (suspensión de juicios y aplazamiento de trámites), y a los centros de salud, donde los médicos no pudieron acceder a las historias clínicas de los pacientes, ni tampoco emitir recetas electrónicas, ni acceder a la intranet para ver resultados de pruebas diagnósticas o pedir análisis.

La incidencia tuvo lugar sobre las 21.00 horas del lunes 27 bloqueando los servicios durante todo el día, ya que, según se indica en la nota de prensa, no se pudo comenzar a reestablecerlos, de forma gradual, sino a partir de las 20.00 horas del día siguiente.

La información disponible es muy escasa (sólo dos referencias en prensa) y correspondiente exclusivamente a las horas inmediatamente posteriores al suceso, sin que exista una explicación posterior sobre el asunto. Por ello, para valorar el hecho, tendremos que basarnos en las siguientes afirmaciones recogidas en las dos noticias.

  • El origen del problema fue un fallo eléctrico registrado en la zona Walqa. Esto supuso un bloqueo de forma automática en el hardware del centro de datos para salvaguardar los datos y su integridad
  • El error fue detectado durante la madrugada (el error ha sido localizado» y se está trabajando para recuperar la normalidad cuanto antes), comenzando los trabajos de resolución de la incidencia, pero dado que “procedía de varios focos” el diagnóstico no pudo ser rápido
  • La DGA anunció que no descarta penalizaciones al proveedor por los inconvenientes que el fallo ha generado. La indemnización podría llegar a los 100.000 euros
  • Pese al fallo eléctrico que se registró en Walqa, y que afectó de forma grave al centro de datos de la DGA, se trabajó “con absoluta normalidad” durante todo el día, “Hemos venido a primera hora y todo funcionaba correctamente. No se ha producido un corte de luz que nosotros hayamos notado, por lo que el problema se ha tenido que centrar solo en la conexión de la sede de Aragonesa de Servicios Telemáticos (AST)”

Con estos datos, las primeras conclusiones tienen que apuntar hacia los siguientes escenarios y sus correspondientes consideraciones asociadas:

  1. Una vez más, se trata de un fallo eléctrico, sin que en este caso existan datos sobre el mismo, pero que pasa a engrosar una estadística que indica que por encima del 80% de las caídas de infraestructura, son eléctricas.
  2. El hecho de que en el resto del Parque Walqa no se hayan registrado incidencias, debería eliminar la posibilidad de una pérdida prolongada de suministro y la consabida, y habitual, incidencia de caída por la no entrada de los grupos de respaldo.
  3. Lo que no encaja mucho en esta historia es el hecho de que el suceso tuviese varios focos, más allá de la intención de darle a este asunto una narrativa similar a la de un incendio
  4. El resto de alternativas con mayor probabilidad pasaría por el funcionamiento de los UPSs ante una pérdida, más o menos instantánea, de suministro (en este caso debería verificarse la topología de diseño, siendo tanto mayores las probabilidades de que sea esta la causa de la caída cuanto que se trate de una topología redundante paralela) y, cómo no, por la posibilidad de que el suceso haya sido provocado por un error humano en cualquiera de las intervenciones que se realizan en el centro.
  5. Por último, y como nuevo ejemplo de cómo se explican las cosas desde el lado IT, destacar que, en lugar de decir que se perdió la alimentación y los servidores se fueron a paseo, se adorna el tema diciendo que el bloqueo fue automático en el hardware para salvar los datos y su integridad, lo cual, como todo el mundo sabe, es mucho menos malo.

En definitiva, consultada la casa de apuestas bet24x7, las distintas opciones que se plantean como explicación de este suceso son:

  • Fallo humano, que se paga a 1,3€ por € apostado
  • Fallo en UPSs, 1,5€ por € apostado
  • Fallo en grupos. 8€ por € apostado

No obstante lo anterior, siempre puede saltar la sorpresa, aunque mucho me temo que, dado el hermetismo con el que se está tratando el tema, no podamos salir de dudas. Y, como siempre en estos casos, permaneceremos atentos a cualquier noticia adicional que pueda surgir, siendo bienvenida cualquier información o corrección sobre lo aquí expresado. 

Garcerán Rojas