Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

LOS CASICEROS

POSTED BY Garcerán Rojas 15 de junio de 2018

Ese tipo de situaciones donde nos encontramos al borde del abismo, a punto de caramelo, en el filo de la navaja o, directamente, bajo la espada de Damócles pero donde, no se sabe muy bien desde qué lugar, aparece finalmente el ángel de la guarda, el séptimo de caballería o el primo de Zumosol. Son los conocidos como “CASICEROS”.

Llevamos ya unos cuantos años hablando de los ceros en los Data Center, de sus causas y de las consecuencias que generan y, aunque en ocasiones se nos haya tachado de alarmistas, la cruda realidad siempre acaba poniendo a cada uno en su sitio y, a los hechos que no tienen marcha atrás, en primera página. A ello hay que añadir que, en los últimos meses, podríamos decir que se ha puesto de moda que los ceros afecten a Data Centers de mayor nivel, al menos teórico.

Sin embargo, en el día a día de estos entornos de misión crítica hay también un buen número de situaciones en las que el camino hacia el cero se encuentra en pleno desarrollo pero que, de una forma u otra, sucede algo que lo evita. Es decir, que el drama no llega a tener lugar, pero por los pelos.

Ese tipo de situaciones donde nos encontramos al borde del abismo, a punto de caramelo, en el filo de la navaja o, directamente, bajo la espada de Damócles pero donde, no se sabe muy bien desde qué lugar, aparece finalmente el ángel de la guarda, el séptimo de caballería o el primo de Zumosol. Son los conocidos como “CASICEROS”.

En nuestra, ya larga, trayectoria en esto de los CPDs, son muchas las ocasiones donde hemos tenido relación con sucesos asociados a escenarios de casiceros por lo que, a continuación, ofreceremos algunos ejemplos, al tiempo que dejaremos una puerta abierta a posibles contribuciones de terceros que puedan aportar más amplios puntos de vista y nuevas situaciones que puedan servir de ejemplo y aprendizaje para todos. Todas ellas serán muy bienvenidas.

  • Como primera familia de eventos podemos definir aquellos relacionados con el fallo cruzado de componentes de capacidad en entornos de redundancia distribuida y que tiene por solución de emergencia el “cruzado mágico”, es decir, el cruzado inverso al del fallo aprovechando los componentes que permanecen sanos en el servicio. No es que sea muy habitual asistir al fallo de una rama de UPS y, simultáneamente, al del sistema de alimentación red-grupo de la otra, pero sí que hemos podido constatar cómo la disposición cruzada de los elementos restantes ha podido salvar situaciones de auténtica angustia.
  • Claro está que las posibilidades de cruzamiento entre ramas independientes, dota al sistema de mayor versatilidad pero, por el contrario, puede ser un arma de doble filo si la intervención no reside en manos expertas. Además, en los últimos tiempos, hemos analizado bastantes proyectos donde esta posibilidad de interconexión se encuentra diseñada en varios puntos de la distribución eléctrica (hemos llegado a ver proyectos con hasta 6 puntos de interconexión. Los transformadores de A y B, los embarrados generales, los grupos, las entradas de SAIs, las salidas de SAIs y las PDUs) y el peligro de maniobra en falso aumenta a medida que nos movemos hacia posiciones aguas abajo en los circuitos.
  • Otro tipo de sucesos bastante recurrente es el relacionado con el arranque de los grupos electrógenos, colchón último de seguridad para la disponibilidad del servicio. En tiempos como los actuales donde existe una clara tendencia hacia una automatización generalizada, las posibilidades de intervención manual se echan muchas veces en falta, sobre todo por parte de aquellos a los que esa herramienta nos ha salvado bastantes veces de caer en situaciones muy peligrosas. Arrancar un grupo a mano puede parecer una tontería, pero a mi me gusta que estos sistemas, digámoslo así, dispongan de pedales y manivela. De ello puede depender la salvadora llegada a tiempo. Una variante de esta situación la encontramos en sistemas conectados en paralelo con el correspondiente sincronismo pero equipados con elementos de corte entre las distintas ramas con la posibilidad de realizar conexiones directas a las cargas.

Otras situaciones típicas de lo que estamos señalando, y relacionadas con el sistema de respaldo, son las derivadas de la realización de pruebas en condiciones de normalidad en cuanto al suministro principal. Con ello, se han podido simular condiciones de error sin consecuencias y sin tener que llegar al momento en el que el sistema falla cuando es el último recurso.

Existen muchos más ejemplos, con argumentos de mayor detalle, que pueden engrosar un capítulo de varios, entre los cuales los siguientes:

  • La monitorización de la tensión de baterías en procesos de intervención rápida dentro de periodos de autonomía de los SAI  ha permitido reaccionar a tiempo cuando el tiempo previsto no se corresponde con una realidad mucho más “recortada”.
  • La comprobación del estado de los UPS previa a cualquier paso programado de red a grupo, con paso por cero, ha permitido impedir el proceso en situaciones de UPS en bypass no detectadas por las correspondientes alarmas o detectores.
  • El recurso de un pequeño generador portátil ha permitido alimentar bobinas de interruptores generales que, fruto de esa puñetera manía que entró a muchas ingenierías de alimentar los mandos de las transferencias desde SAI, llevó a situaciones donde ante una caída del SAI, el resto quedaba inoperativo y sin posibilidad alguna de accionamiento manual.

Puede observarse cómo todos los ejemplos anteriores pertenecen al terreno de lo eléctrico. Ello no quiere decir que no existan otras vías de penetración para el enemigo, pero las estadísticas están ahí y, por encima de un 85% de los problemas que derivan en una pérdida de disponibilidad lo tenemos en esa parte.

Lo que sí podemos afirmar es que todos los movimientos que se realizan en circunstancias como las descritas son enormemente delicados y, como tales, deben ser efectuados por personal preparado y, a poder ser, siguiendo un procedimiento escrito y ensayado. De lo contrario, el éxito está poco garantizado ya que, normalmente, las acciones que se emprenden en situación de urgencia no suelen llevar consigo la templanza necesaria y suficiente para ser certeros, entrando, no sólo en el peligroso y resbaladizo terreno de no poder evitar el cero, sino en la hecatombe de provocar un segundo cero de forma inmediata, pero de este asunto hablaremos en otro momento.

En lo que respecta a los casiceros, este texto no lo cerramos, dejando abierta la puerta a contribuciones que, a modo de ejemplo, puedan complementar lo anteriormente expuesto. Sería un placer poderlas agrupar y clasificar de una forma ordenada.

Garcerán Rojas