Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

Nueva encuesta anual de Uptime Institute sobre data centers

POSTED BY Garcerán Rojas 11 de August de 2020

Los datos provienen de casi 900 data center repartidos por todo el mundo (algo más de la mitad en USA, Canada y Europa)

Como todos los últimos años, y coincidiendo con la época estival, Uptime Institute ha publicado su encuesta anual sobre el mundo de los data center. Se trata de un documento muy completo, perfectamente desarrollado y explicado y del que se desprende una serie de importantes conclusiones.

A la hora de mencionar las distintas referencias obtenidas de su lectura, y como quiera que los temas tratados son muy dispares, me gustaría hacer alusión en este foro a los distintos asuntos, pero de forma individual. Y para ello, comenzaremos por entrar en algo que suele tener bastante difusión entre nuestras páginas y que no es otra cosa que las sempiternas caídas del servicio. Los conocidos “ceros”. (ver más abajo lecturas recomendadas)

El informe, como preámbulo de ese capítulo, afirma que los resultados no pueden menos que hacer sonar las alarmas. Y el hecho es que las caídas se producen con una frecuencia “perturbadora”, las más grandes son cada vez más dañinas y costosas y, aquello que se ha podido ganar con la mejora de los procesos, ha sido parcial y negativamente contrarrestado por los retos de mantener sistemas cada vez más complejos.

Desde la óptica del número de casos, si bien en 2019 un tercio de los encuestados había sufrido un cero en los últimos 12 meses (y la mitad, uno en los últimos tres años), en 2020 la cifra se eleva hasta el 78% al considerar ese plazo de tres años, aunque el 41% las califican como mínimas o insignificantes. Ello quiere decir que existe un 31% de data centers que en los últimos tres años ha sufrido al menos un cero que calificar como significativo (17%), serio (10%) o severo (4%).

No creo que merezca la pena hacer comentario alguno. Los números hablan por sí solos.

Por otra parte, entre los que han reconocido haber tenido un cero, el número de entrevistados que considera que la caída habría sido evitable alcanza una proporción del 75%, apreciablemente mayor que el 60% de 2019. Aquí se percibe una buena dosis de autocrítica.

En lo que respecta al coste de la pérdida del servicio, un 16% (10% en 2019) lo considera por encima de un millón, mientras un 40% (28% en 2019) lo hace entre cien mil y un millón. Eso sí, mencionar aquí que, existen tres casos donde el coste de la caída supera los 25 M siendo el equivalente de 10 en 2019.

En todo caso, solamente un 50% de los entrevistados calculan los costes de las caídas, por lo que, sin una cifra de referencia, difícilmente pueden llegar a valorarse correctamente las posibles acciones encaminadas a mejorar la resiliencia.

Por último, resaltar cómo, nuevamente, la alimentación eléctrica se encuentra en cabeza de la lista de responsables de estas caídas, con un 37%, seguida de los errores en los sistemas IT y el software (22% aunque sus consecuencias son menores), asuntos de red (17%), cooling (13%), problemas en proveedor del servicio (5%), PCI (4%), seguridad (2%), reservándose también un 1% para el bloque típico de NPI, pero eso hace que el total sume 101 (hasta los informes mejor presentados se les escapa a veces algún pequeño detalle.)

En definitiva, a los números que se presentan se les puede aplicar la credibilidad estadística propia de una muestra cercana a la cifra de 900, que es muy alta. Por ello, las conclusiones son muy creíbles y no hacen sino apuntalar la línea de comunicación que venimos realizando desde hace ya bastantes años:

  • Muchos no son conscientes de los riesgos que tiene entre sus manos hasta que estos se manifiestan
  • Los presupuestos para operación y mantenimiento se encuentran a la baja, siendo la actividad principal y la más relacionada con las caídas
  • El ciclo del fallo es una realidad en las organizaciones
  • No se realizan, de forma sistemática, ensayos reales con pérdida de alimentación, estando relacionada una buena proporción de las caídas con el incorrecto funcionamiento de la planta de emergencia.
  • Los assessment especializados brillan por su ausencia

Con ello, las cifras que vaya a presentar el análisis 2021 no tienen mucha pinta de que nos muestren un cambio de rumbo. Y si no, al tiempo.

Garcerán Rojas