Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

Caída Microsoft Azure el 4 de septiembre

POSTED BY Garcerán Rojas 05 de septiembre de 2018

La noticia salta el mismo día 4 de septiembre, cuando el servicio cloud de Microsoft Azure queda interrumpido por la caída parcial de uno de sus Data Centers.

Las primeras noticias provinieron de clientes que no podían acceder al servicio cloud.

No obstante, el acceso a la página de status, aunque de forma intermitente, continuaba disponible y en ella se informaba sobre un problema relacionado con la climatización que había afectado a una parte de un data center. Se indicaba también cómo el incidente estaba afectando solamente a la región Centro-Sur de USA.

Al parecer, el suceso se inició a las 9:29 del 4 de setiembre de 2018, siendo, en principio, su origen el sistema de clima y la consecuencia una elevación de temperatura que puso en marcha el protocolo automático de apagado como autoprotección del hardware.

El impacto sobre el sistema de clima, según los representantes de la compañía, fue identificado y aislado y los trabajos para reestablecer el servicio puestos en marcha.

Ya en posteriores comunicaciones, se comienza a reconocer un “problema de red”, insistiendo en que sólo se ha visto afectada la región indicada anteriormente, aunque bastantes usuarios indican ya que el impacto es más amplio, llegando incluso a Europa occidental.

Casi 24 horas más tarde, Microsoft Aazure indicó que los trabajos de recuperación continuaban, reconociendo la afectación a otras zonas y justificándolo en la interconexión de todos sus data centers, y en el efecto cascada cuando se produce un fallo en uno de ellos. Se habían visto afectados aproximadamente 40 servicios, incluyendo Exchange, SharePoint y Teams del Office 365.

Según iba avanzando el día, se fue produciendo un giro en la orientación de la historia, señalando como origen los efectos de severos sucesos atmosféricos, rayos incluidos, que habían generado fuertes aumentos de tensión, que afectaron a los equipos de clima del data center de San Antonio (Texas).

Finalmente, el suministro eléctrico al data center en cuestión quedó completamente reestablecido, pero las labores de recuperación completa del servicio, se encontraban aún por finalizar.

A diferencia de otros casos anteriores, sobre los que he tenido la oportunidad de escribir, la explicación, tal como se ha producido, puede ser verosímil. Como casi siempre, los primeros mensajes tratan de minimizar el impacto y de tranquilizar a los usuarios, cosa que rara vez se consigue.

La permanencia del fallo da mayor inquietud al usuario pero mayor perspectiva a la compañía propietaria del servicio quien empieza a aportar detalles más o menos convincentes.

En este caso, la acusada, como en otros casos anteriores, es la elevación de la tensión de suministro, bien por causas atmosféricas (Amazon Ashburn, Fujitsu Perth, Singapur Stock Exchange o Google) o de otra índole parecida (British Airways, Claro, Amazon en Dublín o el mismo Microsoft).

Como siempre en estos casos, he consultado la casa de apuestas BET 24x7 y, que sea cierta la explicación, se paga sólo a 1,3 por euro apostado.

Si se confirma, la conclusión es, una vez más, que la protección ante fenómenos de sobretensión transitoria es una de las grandes asignaturas pendientes que tenemos en las instalaciones eléctricas en general y. por tanto, en nuestros data centers de misión crítica.

Garcerán Rojas